Технологии оцифровки текстовой информации.
⇐ ПредыдущаяСтр 2 из 2 Оцифровка книг — это процесс перевода бумажных книг в электронный (цифровой) вид. Электронные копии книг могут образовывать электронные библиотеки и распространяться в Сети. Цифровые книги можно легко распространять, воспроизводить и читать на экране. Обычно оцифрованные книги сохраняют в форматах: DjVu, Portable Document Format (PDF), JPG или TIFF. Для преобразования исходного изображения используют оптическое распознавание символов (OCR), оно необходимо для включения страниц книги в цифровой формат, такой, как ASCII, или другой подобный формат, который уменьшает размер файла и позволяет работать с текстом. Сканирование изображений может происходить вручную или автоматически. В обычных сканерах книга располагается на стекле, на книгу падает свет, и оптический механизм сканирует книгу, двигаясь под стеклом. Другие книжные сканеры используют V-образную раму и фотографируют страницы сверху. Страницы могут переворачиваться вручную или с помощью автоматических устройств подачи бумаги. Специальное массивное стекло, как правило, прижимает страницы, чтобы сгладить недостатки сканирования. После сканирования программа корректирует изображение документа, выравнивая его, обрезая, редактируя и преобразовывая его в текст, и окончательную форму электронной книги. Люди обычно проверяют отсканированное изображение на наличие ошибок. Сегодня процесс оцифровки включает два подхода. · Обязательный: получение копий страниц в виде графических (обычно растровых) изображений, осуществляемое путём сканирования или фотографирования с последующей обработкой и сохранением в одном из форматов графических файлов. В этом случае полностью сохраняется оригинальная вёрстка книги, и исключаются какие-либо ошибки, однако невозможен поиск или извлечение фрагментов текста для, например, целей цитирования.
· Опциональный: распознавание текста (технология «оптического распознавания символов» — OCR) с последующим сохранением распознанного текста в одном из форматов электронных книг. В этом случае становится возможен полнотекстовый поиск по книге и индексация больших массивов электронных книг, однако затрудняется воспроизведение оригинальной вёрстки, изображений, схем и формул, практически неизбежны становятся ошибки распознавания. В последнее время (особенно с появлением форматов PDF и DjVu) всё чаще применяется смешанный подход: текст книги распознаётся в автоматическом режиме и подкладывается под оригинальные растровые изображения страниц, что позволяет совместить преимущества обоих подходов. Технологии векторной обработки изображений. Технологии растровой обработки изображений. «Растровая и векторная графика» Для обработки изображений на компьютере используются специальные программы – графические редакторы. Графический редактор – это программа создания, редактирования и просмотра графических изображений. Графические редакторы можно разделить на две категории: растровые и векторные. Растровая графика Программы растровой графики работают с точками экрана (пикселями). Точки не знают, какие объекты они представляют — окружности, линии, прямоугольники. Компьютер запоминает цвет каждой точки, а пользователь из таких точек собирает рисунок, как в детской мозаике. Достоинства растровой графики: Растровые редакторы являются наилучшим средством обработки фотографий и рисунков, т.к. обеспечивают высокую точность передачи градаций цветов и полутонов. Недостатки растровой графики: Изображения, создаваемые в растровых программах, всегда занимают много памяти. По этой причине информация в файлах растрового формата хранится, как правило, в сжатом виде.
Растровые изображения невозможно увеличивать для уточнения деталей. Так как изображение состоит из точек, то увеличение приводит к тому, что точки становятся крупнее, что визуально искажает иллюстрацию. Этот эффект называется пикселизацией. Применение Применяется для обработки фотоизображений, художественной графике, реставрационных работ, работ со сканером. Графические редакторы, в которых используется растровая графика: Paint, PhotoShop. Векторная графика Программы векторной графики хранят информацию об объектах, составляющих изображение в виде графических примитивов: прямых линий, дуг окружностей, прямоугольников, закрасок и т.д. Достоинства векторной графики: * Преобразования без искажений. * Маленький графический файл. * Рисовать быстро и просто. * Независимое редактирование частей рисунка. * Высокая точность прорисовки (до 1 000 000 точек на дюйм). * Редактор быстро выполняет операции. Недостатки векторной графики: * Векторные изображения выглядят искусственно. * Ограниченность в живописных средствах. Применение Применяется в компьютерной полиграфии, системе компьютерного проектирования, компьютерном дизайне и рекламе. Графические редакторы, в которых используется векторная графика: Corel Draw, Adobe Illustrator. Графические редакторы, в которых используется векторная графика: Corel Draw, AdobeIllustrator. Виртуальные музеи. Виртуальный музей (вебсайт-музей) — тип веб-сайта, оптимизированный для экспозиции музейных материалов. Представленные материалы могут быть из самых разных областей: от предметов искусства и исторических артефактов до виртуальных коллекций и фамильных реликвий. Виртуальные музеи за счёт применения интернет-технологий предлагают решение таких традиционных музейных проблем, как хранение, безопасность, обеспечение широкого, быстрого и лёгкого доступа к экспонатам. В отличие от простых коллекций фотографий, виртуальный музей характеризуется такими возможностями, как наличие и расширенными поисковыми возможностями для нахождения и классификации экспонатов. Виртуальный музей (вебсайт-музей) — тип веб-сайта, оптимизированный для экспозиции музейных материалов. Представленные материалы могут быть из самых различных областей: от предметов искусства и исторических артефактов до виртуальных коллекций и фамильных реликвий. Виртуальные музеи преставляют собой удачный пример применения Интернет-технологий для решения проблем хранения, безопастности и широкого, быстрого и лёгкого доступа к экспонатам.
Первые вебсайт-музеи стали появляться в Интернете в 1991 году. Сначала виртуальные музеи были сайтами реальных музеев, но вскоре стали появляться и персональные вебсайт-музеи. Логика проста: если дом может стать дом-музеем, то домашняя страница может стать страницей-музеем. Первый персональный вебсайт-музей, назвавший себя таковым, появился в 1994 году. Не всякий набор фотографий имеет право называться вебсайт-музеем. Цифровая коллекция виртуального музея должна иметь 2 отличительные характеристики: · виртуальный тур и · продвинутый поиск Один из лучших в мире виртуальных музеев — Государственный Эрмитаж — используя последние Интернет-технологии фирмы Java-апплет HotMedia, а для поиска экспонатов — технология QBIC (Query By Image Content) (англ.). Поиск осуществляется не только по ключевым словам («мужик, и рядом дерево — во такое»), но и по цветовой гамме («50 % жёлтого и 20 % голубого») или композиции («правый верхний угол тёмный, середина светлая»). Одним из первых, кто распознал потенциал вебсайт-музеев был глава фирмы Билл Гейтс. С 1989 года через подставную фирму Corbis (англ.) он скупает права на высококачественное цифровое воспроизведение предметов искусства, исторических артефактов и ценных рукописей. И этот потенциал полностью реализовывается: популярность вебсайт-музеев такова, что домен высшего уровня
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|