Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Технологии оцифровки текстовой информации.




Оцифровка книг — это процесс перевода бумажных книг в электронный (цифровой) вид. Электронные копии книг могут образовывать электронные библиотеки и распространяться в Сети. Цифровые книги можно легко распространять, воспроизводить и читать на экране. Обычно оцифрованные книги сохраняют в форматах: DjVu, Portable Document Format (PDF), JPG или TIFF. Для преобразования исходного изображения используют оптическое распознавание символов (OCR), оно необходимо для включения страниц книги в цифровой формат, такой, как ASCII, или другой подобный формат, который уменьшает размер файла и позволяет работать с текстом. Сканирование изображений может происходить вручную или автоматически. В обычных сканерах книга располагается на стекле, на книгу падает свет, и оптический механизм сканирует книгу, двигаясь под стеклом. Другие книжные сканеры используют V-образную раму и фотографируют страницы сверху. Страницы могут переворачиваться вручную или с помощью автоматических устройств подачи бумаги. Специальное массивное стекло, как правило, прижимает страницы, чтобы сгладить недостатки сканирования. После сканирования программа корректирует изображение документа, выравнивая его, обрезая, редактируя и преобразовывая его в текст, и окончательную форму электронной книги. Люди обычно проверяют отсканированное изображение на наличие ошибок.

Сегодня процесс оцифровки включает два подхода.

· Обязательный: получение копий страниц в виде графических (обычно растровых) изображений, осуществляемое путём сканирования или фотографирования с последующей обработкой и сохранением в одном из форматов графических файлов. В этом случае полностью сохраняется оригинальная вёрстка книги, и исключаются какие-либо ошибки, однако невозможен поиск или извлечение фрагментов текста для, например, целей цитирования.

· Опциональный: распознавание текста (технология «оптического распознавания символов» — OCR) с последующим сохранением распознанного текста в одном из форматов электронных книг. В этом случае становится возможен полнотекстовый поиск по книге и индексация больших массивов электронных книг, однако затрудняется воспроизведение оригинальной вёрстки, изображений, схем и формул, практически неизбежны становятся ошибки распознавания.

В последнее время (особенно с появлением форматов PDF и DjVu) всё чаще применяется смешанный подход: текст книги распознаётся в автоматическом режиме и подкладывается под оригинальные растровые изображения страниц, что позволяет совместить преимущества обоих подходов.

Технологии векторной обработки изображений.

Технологии растровой обработки изображений.

«Растровая и векторная графика»

Для обработки изображений на компьютере используются специальные программы – графические редакторы.

Графический редактор – это программа создания, редактирования и просмотра графических изображений.

Графические редакторы можно разделить на две категории: растровые и векторные.

Растровая графика

Программы растровой графики работают с точками экрана (пикселями). Точки не знают, какие объекты они представляют — окружности, линии, прямоугольники.

Компьютер запоминает цвет каждой точки, а пользователь из таких точек собирает рисунок, как в детской мозаике.

Достоинства растровой графики:

Растровые редакторы являются наилучшим средством обработки фотографий и рисунков, т.к. обеспечивают высокую точность передачи градаций цветов и полутонов.

Недостатки растровой графики:

Изображения, создаваемые в растровых программах, всегда занимают много памяти. По этой причине информация в файлах растрового формата хранится, как правило, в сжатом виде.

Растровые изображения невозможно увеличивать для уточнения деталей. Так как изображение состоит из точек, то увеличение приводит к тому, что точки становятся крупнее, что визуально искажает иллюстрацию. Этот эффект называется пикселизацией.

Применение

Применяется для обработки фотоизображений, художественной графике, реставрационных работ, работ со сканером.

Графические редакторы, в которых используется растровая графика: Paint, PhotoShop.

Векторная графика

Программы векторной графики хранят информацию об объектах, составляющих изображение в виде графических примитивов: прямых линий, дуг окружностей, прямоугольников, закрасок и т.д.

Достоинства векторной графики:

* Преобразования без искажений.

* Маленький графический файл.

* Рисовать быстро и просто.

* Независимое редактирование частей рисунка.

* Высокая точность прорисовки (до 1 000 000 точек на дюйм).

* Редактор быстро выполняет операции.

Недостатки векторной графики:

* Векторные изображения выглядят искусственно.

* Ограниченность в живописных средствах.

Применение

Применяется в компьютерной полиграфии, системе компьютерного проектирования, компьютерном дизайне и рекламе.

Графические редакторы, в которых используется векторная графика: Corel Draw, Adobe Illustrator. Графические редакторы, в которых используется векторная графика: Corel Draw, AdobeIllustrator.

Виртуальные музеи.

Виртуальный музей (вебсайт-музей) — тип веб-сайта, оптимизированный для экспозиции музейных материалов. Представленные материалы могут быть из самых разных областей: от предметов искусства и исторических артефактов до виртуальных коллекций и фамильных реликвий. Виртуальные музеи за счёт применения интернет-технологий предлагают решение таких традиционных музейных проблем, как хранение, безопасность, обеспечение широкого, быстрого и лёгкого доступа к экспонатам.

В отличие от простых коллекций фотографий, виртуальный музей характеризуется такими возможностями, как наличие и расширенными поисковыми возможностями для нахождения и классификации экспонатов.

Виртуальный музей (вебсайт-музей) — тип веб-сайта, оптимизированный для экспозиции музейных материалов. Представленные материалы могут быть из самых различных областей: от предметов искусства и исторических артефактов до виртуальных коллекций и фамильных реликвий. Виртуальные музеи преставляют собой удачный пример применения Интернет-технологий для решения проблем хранения, безопастности и широкого, быстрого и лёгкого доступа к экспонатам.

Первые вебсайт-музеи стали появляться в Интернете в 1991 году. Сначала виртуальные музеи были сайтами реальных музеев, но вскоре стали появляться и персональные вебсайт-музеи. Логика проста: если дом может стать дом-музеем, то домашняя страница может стать страницей-музеем. Первый персональный вебсайт-музей, назвавший себя таковым, появился в 1994 году.

Не всякий набор фотографий имеет право называться вебсайт-музеем. Цифровая коллекция виртуального музея должна иметь 2 отличительные характеристики:

· виртуальный тур и

· продвинутый поиск

Один из лучших в мире виртуальных музеев — Государственный Эрмитаж — используя последние Интернет-технологии фирмы Java-апплет HotMedia, а для поиска экспонатов — технология QBIC (Query By Image Content) (англ.). Поиск осуществляется не только по ключевым словам («мужик, и рядом дерево — во такое»), но и по цветовой гамме («50 % жёлтого и 20 % голубого») или композиции («правый верхний угол тёмный, середина светлая»).

Одним из первых, кто распознал потенциал вебсайт-музеев был глава фирмы Билл Гейтс. С 1989 года через подставную фирму Corbis (англ.) он скупает права на высококачественное цифровое воспроизведение предметов искусства, исторических артефактов и ценных рукописей. И этот потенциал полностью реализовывается: популярность вебсайт-музеев такова, что домен высшего уровня

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...