Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Фактографические базы и банки научных данных

 

 Современный этап развития науки характеризуется переходом на качественно новый уровень исследований, что определяется широким использованием методов и средств информатики - науки о законах и методах накопления, обработки и передачи информации. В науке применение методов и средств информатики должно не только освободить исследователя от рутинной работы по поиску и подготовке к использованию известной информации, но и обеспечить реализацию единой линии математической технологии решения задач - от формулировки математических моделей и их полного информационного обеспечения всеми необходимыми данными до формирования программных комплексов и проведения решения поставленных задач. Важно, чтобы эта линия была непрерывной и оперативно действующей, без технологических разрывов в обработке данных. По существу, это определяется решительным превращением разрозненной информации, отдельных наборов данных и индивидуальных программ в единый информационный и программный продукт, а также всесторонним применением современных приемов манипулирования такими продуктами с использованием средств вычислительной техники.

 К середине 90-ых годов в РФ в области фактографических баз данных в науке сложилась ситуация, характеризующая следующими особенностями:

 1. Существует значительное количество практически не связанных друг с другом информационно-решающих систем и банков фактографических данных. Имеется дублирование в разработке БД и БнД, и в то же время появление БД в таких областях знаний, где ими пользуется только узкий круг специалистов. Эти банки данных создаются давно сложившимися научными коллективами и поддерживаются ими прежде всего для информационного обеспечения собственных нужд (новые технологии подготовки справочников, работы в рамках между народного сотрудничества и т.д.). В отраслевых НИИ фактографические БД создавались в интересах поддержания того или иного рабочего места (АРМ) технолога, конструктора и т.п.

 Такие БД имеют очень ограниченную доступность, использование их для широкого круга пользователей проблематично, а их учет и регистрация затруднены.

 2. Развиваются как большие фактографические БД (например, по структурам химических веществ, спектроскопии и т.д.), так и специальные БД, например, по химии особо чистых веществ, физико-химической кинетике газовых реакций и т.п.). Эта тенденция в полной мере отвечает и зарубежному опыту.

 3. Отсутствуют по большей части мотивы к кооперации и интеграции разработчиков ФБнД. Расширение узкоспециальных ФБнД, приспособленных к решению только одного класса за дач, на другую предметную область требует заново решать проблему выбора программных средств, т.к. при этом меняются структуры фактографических данных.

 4. Фактографические БД формируются двумя способами:

1) на основенакопленных разработчиками больших массивов одно родной информации; 2) на основе документальных потоков существующих документографических БД.

 5. Понижено доверие специалистов к фактографическим, прежде всего численным данным, получаемым из БнД, вследствие большой вероятности ошибок при вводе значений. Проблема проверки достоверности информации перед ее загрузкой в БД является актуальной и за рубежом, и в РФ. Для отечественных фактографических БнД она решена только в части единичных функционирующих БД. Для большинства отечественных фактографических БнД эта проблема остается актуальной в силу отсутствия финансирования и других ресурсов.

 Представление научной информации в фактографических БД имеет следующие особенности:

 - трудная формализуемость многих типов данных;

 - актуальность многих, прежде всего, экспериментальных данных в течение длительного времени (часто многими десятилетиями);

 - использование аналитических форм представления данных (уравнения состояния, уравнения термодинамического подобия и другие зависимости), необходимым компонентом ФБнД в науке, как правило, является модель предметной области, вне связи с которой, данные теряют смысл;

 - наличие нескольких видов данных, отличающихся способом обработки. Несмотря на общность подходов к информации в науке, формируются представлением непосредственно полученных или выявленных из литературных источников численных и структурных данных, графической информации, тем не менее наблюдаются и значительные отличия в различных областях знания: степень систематизации данных, уровень достоверности данных и возможности их экспертной проверки, традиционные способы представления информации, степень вариабельности данных и т.д.

 К настоящему времени выделились два подхода к созданию фактографических БД. Условно их можно назвать "исследовательским" и "библиотечным".

 Наиболее характерная черта "исследовательских" БД – целенаправленный отбор информации для решения заранее сформулированной исследовательской задачи.

 При "библиотечном" подходе сбор информации, как правило, непосредственно не связан с ее использованием. БД формируются преимущественно в ходе централизованной работы крупных научных и информационных центров и пополняются новыми данными без изменения уже существующей структуры информационного массива.

 Свертывание научной информации, которое связано с функционированием БД, позволяет пользователю в более сжатые сроки и в концентрированном виде получить интересующие его сведения, в большинстве своем прошедшие экспертную проверку на достоверность. Таким образом, разработка и эксплуатация БД в той или иной области науки или техники позволяет значительно увеличить доступную пользователю долю информационных ресурсов и, в конечном итоге, приводит к по лучению нового знания.

 С распостранением персональной техники с современным сервисным обеспечением появляется возможность создания локальных баз данных, необходимых для научных исследований.

 Информация для таких баз заимствуется из обзоров, справочников, отдельных оригинальных работ и других источников, и значительно реже - из банков данных. Однако качество информации, предлагаемой пользователям банками данных, существенно выше, поскольку эта информация проходит экспертный анализ на достаточно высоком уровне - в среде специалистов по данному вопросу, и оперативно обновляется.

 Появление значительного числа проблемоориентированных локальных БД в различных областях науки, реализованных как правило, на ПЭВМ, особенно остро ставит задачу координации работ в области информационного обеспечения научных исследований. За последние годы во многих странах возникли специальные организации, деятельность которых направлена, с одной стороны, на сбор, систематизацию и распространение информации о функционирующих или только проектирующихся БД (объеме и содержании информационного массива и комплексе информационных услуг), а, с другой стороны, на стимулирование и финансирование проектов, связанных с созданием БД, совершенствованием их программного и лингвистического обеспечения, а также разработкой единых стандартов при переводе данных в машиночитаемую форму.

 При объединении локальных БД в информационную сеть одна из основных задач - обеспечение прямой и надежной связи между банками данных и личными локальными базами данных, оперативное наполнение таких локальных баз информацией из банков данных. Такая связь и поддержка локальных баз данных уже хорошо освоена в США (например, система STN) и Западной Европе. Банки данных, не включенные в сети, имеют возможность оперативно передавать данные по инетрнету. В связи с этим необходимо обеспечить организацию современных методов передачи информации банков фактографических данных по сетям. Помимо решения технических проблем это потребует от системной организации банков данных обеспечения возможности формирования передаваемых файлов данных независимо от конкретной СУБД и типа машинной реализации, ведения гибких форматов и соответствующих интерфейсов средств обмена данными в разных форматах.

 База данных может быть централизованной или распределенной. Централизованная база поддерживается одной ЭВМ. Распределенные базы можно разделить на два типа. В од ном случае каждый пользователь имеет почти все данные на своей ЭВМ, в другом случае каждый вид данных находится в каком-то одном месте и центральная ЭВМ поддерживает только каталог всех данных с указанием местонахождения конкретных данных. По-видимому, наиболее перспективной является последняя система организации.

 При проектировании в систему, помимо трдиционного хранилища информации, могут входить также следущие подсистемы:

 - библиотека научных программ для обработки данных (моделирование, вычислительный эксперимент и др.);

 - библиотека статистической обработки данных (регрессионный анализ, сглаживание, оценка достоверности, получение значений коэффичиентов эмпирических и теоретических зависимостей, графический пакет и т.д.);

 - буфер получаемых данных для их предварительного анализа (возможно и архив результатов);

 - ряд служебных подсистем, таких, как вводи коррекция данных, обмен данными между хост-машиной и локальными системами и др.

 Форма вывода данных определяется потребностью конкретных пользователей. БнД должен выполнять широкий спектр запросов от простейших информационных до слжных, требующих расчетов по прикладным программам.

 БнД может быть использован также как программная основа автоматизированного рабочего места исследователя с правом доступа к справочным данным и внесением собственных данных в имеющуюся БД.

Особое внимание следует обратить на открытость систем, особенно в частности возможности включения программ математической обработки данных.

 ФБнД в области науки должны обладать возможностью восполнения недостающих данных при помощи баз моделей, алгоритмов и программ расчета и т.п.

 Пользователю БнД должна быть предоставлена возможность доступа к любым имеющимся в нашей стране и за рубежом документографическим системам.

 Интеграцию разнородных БД в общие мультидисциплинарные банки должны обеспечивать мировые центры данных и БнД специальных проектов. При этом БД верхнего уровня должны выполнять роль баз данных и содержать информацию о наличии данных в банках нижнего уровня.

 Одной из важнейших проблем, решаемых в ходе разработки ФБнД, является создание экспертной службы (ЭС). ЭС выполняют три функции: сигнальную, аналитическую и справочную. Типичными формами ЭИ являются:

 - для сигнальной информации - экспертные рефераты;

 - для аналитической информации - текущие и ретроспективные аналитические обзоры;

 - для справочной информации - таблицы фактографических данных. Экономический механизм создания и развития ФБнД в науке механизмом финансирования исследований, в результате которых формируется ФБнД (через научные фонды, ассоциации и т.п.).В особых случаях ФБнД в науке могут финансироваться государством. Обслуживание по таким ФБнД должно производиться на бесприбыльной основе (например, в образовании).

ФБнД в науке представляют собой национальное достояние и подлежат экспортному лицензированию.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...