Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Розділ 5. Представлення анімаційної, відео- та звукової інформації




Розділ 5. Представлення анімаційної, відео- та звукової інформації

При роботі з цифровим відеосигналом виникає необхідність обробки, передачі й збереження дуже великих обсягів інформації. На сучасних носіях, таких, як компакт-диск (CD-ROM, 650 Мбайт) чи жорсткий диск (порядку тисячі мегабайт), зберегти повноцінний за часом відеоролик, записаний у поелементному форматі, не вдається. З іншого боку, відеоінформація повинна передаватися зі швидкістю її відтворення на екрані комп'ютера. Так, повноколірне (24 біт/ піксель) зображення розміром 720Х576 пікселів із розрахунку 25 кадр/с вимагає швидкості передачі відеоданих 240 Мбіт/с. Однак пропускна здатність каналів ЛВС FDDI - порядку 100-200 Мбіт/с, а Ethernet - лише 10 Мбіт/с.

Тому використання відеоданих у складі електронних видань виявилось неможливим. Розвиток технологій переведення відеоінформації у цифровий формат і їхнє подальше застосування в цифровому ТБ поставили проблему стиснення відеоданих у ряд найбільш важливих. Її позитивне рішення виявилося можливим лише на базі розробки ефективних методів і алгоритмів стиснення відеоданих.

Слід зазначити, що традиційні алгоритми стиснення даних без втрат тут практично незастосовні, оскільки дають незначний виграш для реальної відеоінформації. Наприклад, алгоритми, засновані на компресії за рахунок кодування довжинами серій і адресно-позиційного кодування (RLE, LZ, LZW і т. п. ), не дають належного ефекту.

Для покадрового стиснення відеоданих можна використовувати алгоритми компресії статичної графіки - стиснення з втратами (JPEG). При цьому відновлене зображення кадру, як правило, не збігається з оригіналом. Однак реалізація таких алгоритмів досить складна і процеси декодування вимагають значних витрат часу.

Відеоінформація накладає специфічні обмеження на швидкість декодування даних: декодер (апаратно-програмний засіб, що здійснює декомпресію даних) повинен встигати розархівувати зображення за 1/25 с, поки на екрані відображається попередній кадр. Дане обмеження не дає можливості реалізувати алгоритми з більшим ступенем стиснення.

Ще одне обмеження - складність апаратної реалізації декодувальних пристроїв. У реальних додатках (цифрові відеокамери, відеотелефони, відеофони і т. д. ) оптимальним рішенням проблеми є реалізація алгоритму на замовленому наборі мікросхем з обмеженим числом транзисторів у чіпі. Тому реалізація подібних швидкодіючих декодувальних апаратно-програмних пристроїв не завжди можлива.

Реальним розв’язанням проблеми стало стиснення усього відеоряду, що включає послідовність відеокадрів.

Стандартним методом цифрового кодування на комп'ютері є PCM (Pulse Code Modulation). Найбільш популярним форматом, який використовується для збереження нестиснених аудіоданих, є Microsoft PCM (WAV). Для відеороликів стандартним для комп'ютера вважається Microsoft Audio/Video Interleaved (AVI). Стиснення аудіо- чи відеоданих як процес має на увазі конвертацію відповідно нестисненого WAV- чи AVI- файлу в інший формат із використанням алгоритму стиснення (тому програми для компресії/декомпресії даних називають конверторами). При цьому може бути використаний будь-який формат (навіть WAV і AVI), якщо він підтримує цей алгоритм.

Важливу роль при розв'язанні проблеми стиснення відеоданих відіграли результати, отримані групою комітету зі стандартизації MPEG (Motion Pictures Experts Group). Ця група запропонувала технологію компактного представлення цифрових відео- і аудіосигналів. Основна ідея полягала в перетворенні потоку дискретних цифрових даних у потік деяких записів, що вимагали меншого обсягу пам'яті. Це перетворення базується на використанні статичної надмірності й особливостей людського сприйняття. Закодовані незалежно аудіо- і відеопотоки надалі зв'язуються системним потоком, що здійснює синхронізацію й об'єднання багатьох потоків різних даних в одну кодову послідовність.

Розроблений цією групою метод стиснення і відповідні формати сімейства MPEG успадкували багато чого у своїй структурі від JPEG. Однак на противагу графічним форматам MPEG використовував кодування відмінностей наступних кадрів від деяких базових зображень кадрів. У 1990 р. був створений формат MPEG-1, що орієнтувався на стиснення відео- і аудіоінформації.

Після розробки першого стандарту на стиснення відео- і аудіоінформації ця ж група створила формат і відповідну технологію, орієнтовану на застосування до потоків і відеоданих з більш високою роздільною здатністю. Ефективне представлення черезрядкової розгортки відеосигналу виявилося більш складною задачею, ніж прямі (не черезрядкові) сигнали, визначені MPEG-1. MPEG-2 ввів схему декореляції багатоканального дискретного аудіосигналу об'ємного звуку, використовуючи більш високий фактор надмірності.

Надалі були створені формати MPEG-3, MPEG-4, MPEG-7, MPEG-J.

Сьогодні MPEG - єдиний формат представлення даних специфікації United States Grand Alliance HDTV, групи European Digital Video Broadcasting і Digital Versital Disc (DVD).

У літературі MPEG може поділятися на фази (MPEG-1, MPEG -2, MPEG-4 і т. д. ), а в області аудіоінформації - ще і на рівні (layers). Фази позначаються арабськими цифрами, рівні - римськими. Деякі фази MPEG так і не були закінчені. Наприклад, розробка MPEG-3, призначеного для телебачення високої чіткості (HDTV) із розмірами кадрів 1920Х1080 при частоті зміни 30 кадр/с і можливістю стиснення до 20-40 Мбіт/с, не була довершена, оскільки виявилося, що ця область підтримується форматом MPEG-2. Немає інформації про розробку MPEG-6, що призначався для безпровідної передачі даних; MPEG-8, ціль якого - чотиривимірний опис об'єктів.

Експертна група по мультимедіа і гіпермедіа MHEG (Multimedia Hypermedia Expert Group) визначила стандарт для обміну мультимедійними об'єктами (відео, звук, текст і інші довільні дані) між додатками, і передачі їх різними способами (локальна мережа, мережі телекомунікацій і віщання) із використанням MHEG object classes. Цей стандарт дав змогу програмним об'єктам містити в собі будь-яку систему кодування (наприклад, MPEG), що визначена в базовому додатку. MHEG був прийнятий радою по цифровому відео і звуку (DAVIC - Digital Audio-Visual Council).

MHEG-об'єкти створюються мультимедійними додатками.

Вважається, що MHEG - майбутній міжнародний стандарт для інтерактивного TV, тому що він працює на будь-яких платформах і його документація загальнодоступна.

Поряд із зазначеними стандартними форматами є певна множина форматів кодування відео- і аудіоінформації, запропонованих фірмами, що роблять різні програмні додатки. До них можна віднести: формат RealAudio, розроблений фірмою RealNetworks, для збереження стиснених голосових аудіоданих (мови); формат аудіоданих SoundVQ, розроблений компанією Yamaha; формат Windows Media Technology 4. 0, представлений фірмою Microsoft, підтримує потокову передачу даних у Internet і має розвинену систему стиснення аудіо- і відеоданих; формат QuickTime фірми Apple був розроблений для використання в мультимедійних додатках на комп'ютерах Macintosh і т. п.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...