Различие информации и данных. Базы данных и базы знаний.Определения.Отличия.Основные свойства

Прежде чем продолжить рассмотрение проблематики управления знаниями важно определиться с ключевыми понятиями этой области: «данные», «информация», «знания».

В литературе, посвященной управлению знаниями, представлены различные подходы к их трактовке. Не претендуя на полномасштабный анализ, попробуем обозначить некоторые важные моменты.

Под данными понимаются неупорядоченные наблюдения, числа, слова, звуки, изображения. Это – набор дискретных, объективных факторов о событиях. При этом в организационном контексте данные трактуются как структурированные записи об актах деятельности. Организации обычно хранят данные в информационных системах, в которые они поступают из различных подразделений и служб.

Когда данные организованы, упорядочены, сгруппированы категоризированы, они становятся информацией . Она трактуется как совокупность данных, упорядоченная с определенной целью, придающей им смысл.

Сообщение - это текст, цифровые данные, изображения, звук, графика, таблицы и др

Сведения – практически синоним понятия “Сообщения”. Они чаще всего носят бытовой характер.

Знание же трактуется как информация, готовая к продуктивному применению, действенная, снабженная смыслом. Оно представляет собой совокупность оформленного опыта, ценностей, контекстуальной информации, экспертного понимания, составляющих основу для оценки и интеграции нового опыта и информации. Оно формируется и применяется в умах людей, а в организациях зачастую оказывается закрепленным не только в документах и в хранилищах, но также в организационных процедурах, процессах, способах выполнения работы и нормах.

В таблице на основе обзора литературных источников приводятся различные определения знания.

В большинстве рассмотренных определений подчеркивается, что знания – понятие более широкое, глубокое и богатое по сравнению с информацией. Они представляют собой подвижное соединение разных элементов – опыта, ценностей, информации и экспертного понимания - и постоянно меняются; они интуитивны; характерны для людей и являются неотъемлемой частью человеческой сущности с ее непредсказуемостью.

Данные

Информация

Операции с данными

В ходе информационного процесса данные преобразуются из одного вида в другой. По мере развития НТП и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают (постоянное усложнение условий управления производством и обществом + быстрые темпы появления и внедрения новых носителей/хранителей данных – увеличение объёма данных).

1. Сбор – накопление данных с целью обеспечения достаточной полноты информации для принятия решения;

2. Формализация – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

3. Фильтрация – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

4. Сортировка – упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;

5. Группировка – объединение данных по заданному признаку с целью повышения удобства использования; повышает доступность информации;

6. Архивация – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат на хранение данных и повышает общую надежность информационного процесса в целом;

7. Защита – комплекс мер, направленных на предотвращение утраты, воспроизведение и модификации данных;

8. Транспортировка – прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя – клиентом;

9. Преобразование – перевод данных из одной формы в другую или из одной структуры в другую. Пример: изменение типа носителя; книги – бумага, электронная форма, микрофотоплёнка. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных.

2. Связь понятий «информация, данные, знания». Модель dikw

Универсальных опеределений нет.

Зна́ние - в теории искусственного интеллекта и экспертных систем - совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений. Главное отличие знаний от данных состоит в их структурности и активности, появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Для решения задачи данные обрабатываются на основании имеющихся знаний, информация анализируется с помощью знаний. На основе анализа предлагаются варианты решения, принимвается лучшее, пополняет знания.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний. Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

DIKW (англ. data, information, knowledge, wisdom - данные, информация, знания, мудрость) - информационная иерархия, где каждый уровень добавляет определённые свойства к предыдущему уровню.

Сама модель ведет свои истоки от работ философа Мортимера Адлера, однако впервые в приложении к теории управления знаниями она была формализована Николя Анри. В качестве дополнения в 1989 г. Расселом Акоффом было предложено расширение этой модели слоем «understanding» (понимание): понимание требует анализа и предопределения, благодаря чему оно помещено между знанием и мудростью. Относительно временного распределения слоев он указывает на краткость жизненного цикла информации по сравнению с жизненным циклом знания; понимание считается непостоянным, а мудрость принимается за константу

В основании находится уровень данных.

Информация добавляет контекст.

Знание добавляет «как» (механизм использования)

Мудрость добавляет «когда» (условия использования)


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.

5.1. Отличия знаний от данных

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, об­рабатываемых ЭВМ.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной облас­ти, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

Исходная форма существования данных (результаты наблю­дений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

Представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

Базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда на­зывают структурированными данными. Знания могут быть полу­чены на основе обработки эмпирических данных. Они представ­ляют собой результат мыслительной деятельности человека, на­правленной на обобщение его опыта, полученного в результате практической деятельности.

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем. Первый - по­местить знания в программу, написанную на обычном языке про­граммирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом яв­ляются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.

Второй способ базируется на концепции баз данных и заклю­чается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. Ба­за знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограниче­ния на структуру БЗ и операции с нею. В современных ИИС при­нят этот способ.

Следует заметить, что для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки ин­теллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем зна­ния представляются определенными структурами данных, удоб­ными для хранения и обработки в ЭВМ. Знания в ИИС сущест­вуют в следующих формах:

Исходные знания (правила, выведенные на основе практи­ческого опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением време­ни; функции, диаграммы, графы и т. д.);

Описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или про­дукционных правил, семантическая сеть, фреймы и т. п.);

Представление знаний структурами данных, которые пред­назначены для хранения и обработки в ЭВМ;

Базы знаний на машинных носителях информации.

Что же такое знания? Приведем несколько определений.

Из толкового словаря С. И. Ожегова: 1) «Знание - постиже­ние действительности сознанием, наука»; 2) «Знание - это сово­купность сведений, познаний в какой-либо области».

Определение термина «знания» включает в себя большей частью философские элементы. Например, знание - это проверенный практикой результат познания действительности, верное ее отображение в сознании человека.

Знание есть результат, полученный познанием окружающего мира и его объектов. В простейших ситуациях знания рассматривают как констатацию фактов и их описание.

Исследователями в области ИИ даются более конкретные оп­ределения знаний.

«Знания - это закономерности предметной области (принци­пы, связи, законы), полученные в результате практической дея­тельности и профессионального опыта, позволяющие специали­стам ставить и решать задачи в этой области» .

«Знания - это хорошо структурированные данные или дан­ные о данных, или метаданные» .

«Знания - формализованная информация, на которую ссы­лаются или используют в процессе логического вывода» .

В области систем ИИ и инженерии знаний определение знаний увязывается с логическим выводом: знания - это информация, на основании которой реализуется процесс логического вывода, т.е. на основании этой информации можно делать различные заключения по имеющимся в системе данным с помощью логического вывода. Механизм логического вывода позволяет связывать воедино отдельные фрагменты, а затем на этой последовательности связанных фрагментов делать заключение.

Знания - это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода (рис. 5.1.).


Рис. 5.1. Процесс логического вывода в ИС

Под знанием будем понимать совокупность фактов и правил. Понятие правила, представляющего фрагмент знаний, имеет вид:

Если <условие> то <действие>.

Это определение есть частный случай предыдущего определения.

Однако признается, что отличительные качественные особенности знаний обусловлены наличием у них больших возможностей в направлении структурирования и взаимосвязанности составных единиц, их интерпретируемости, наличие метрики, функциональной целостности, активности.

Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются зна­ния, а не о классификациях. По своей природе знания можно разделить на декларативные и процедурные.

Декларативные знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые воз­можны при манипулировании фактами и явлениями для дости­жения намеченных целей.

Для описания знаний на абстрактном уровне разработаны специальные языки - языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование тради­ционных компьютеров фон-неймановской архитектуры, являют­ся языками процедурного типа. Разработка языков декларатив­ного типа, удобных для представления знаний, является актуаль­ной проблемой сегодняшнего дня.

По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсут­ствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной пред­метной области обстоятельства. Вторая категория знаний осно­вана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила, Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «ЕСЛИ А, ТО В».

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффектив­ной организации процедур логического вывода.

Форма представления знаний оказывает существенное влия­ние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать не­возможно. Поэтому в интеллектуальных системах требуется чет­ко разделить знания на те, которые предназначены для обработ­ки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, в связи с чем неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представ­ления знаний следует учитывать такие факторы, как однород­ность представления и простота понимания. Однородность пред­ставления приводит к упрощению механизма управления знани­ями. Простота понимания важна для пользователей интеллекту­альных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации зна­ний. Следует заметить, что одновременно выполнить эти требо­вания довольно сложно, особенно в больших системах, где неиз­бежным становится структурирование и модульное представле­ние знаний.

Решение задач инженерии знаний выдвигает проблему преобразования информации, полученной от экспертов в виде фактов и правил их использования, в форму, которая может быть эффективно реализована при машинной обработке этой информации. С этой целью созданы и используются в действующих системах различные модели представления знаний.

К классическим моделям представления знаний относятся логи­ческая, продукционная, фреймовая и модель семантической сети.

Каждой модели отвечает свой язык представления знаний. Однако на практике редко удается обойтись рамками одной мо­дели при разработке ИИС за исключением самых простых случа­ев, поэтому представление знаний получается сложным. Кроме комбинированного представления с помощью различных моде­лей, обычно используются специальные средства, позволяющие отразить особенности конкретных знаний о предметной области, а также различные способы устранения и учета нечеткости и не­полноты знаний.

То есть на некотором уровне знания ≡ данные

    Важно: знания задаются какэкстенсионально (эксплицитно, явно), то есть через набор конкретных фактов, соответствующих данному понятию, так иинтенсионально (неявно), то есть через свойства, соответствующие данному понятию.

Данные всегда задаются экстенсионально (явно).

    Внутренняя интерпретируемость знаний, в отличие данных.

Хранение в памяти вместе с элементами данных избыточность системы имён (например, хранить все лексические толкования (словарь)), то есть знания обладают множеством интерпретаций.

    Рекурсивная структурированность знаний (декомпозиция).

    Связанность (взаимосвязь) единиц знаний.

Наличие возможности установления различных отношений, отражающих семиотику и прагматику связей отдельных явлений и фактов, а также отношений отражающих смысл системы в целом, то есть можно задавать крупные единицы знаний как отдельные случаи (CBR).

Случай – как совокупность продукций – семантика.

Прагматика – отношение говорящего к предмету.

    Наличие у знаний семантического пространства с метрикой.

    Активность знаний, в отличие отданных.

То есть возможность ставить цели, достигать цели и т. д.

Активные объекты знаний – агенты.

Агенты обладают ментальными свойствами (то есть тем, что свойственно человеку).

    Функциональная целостность знаний.

    возможность выбора желаемых результатов средств анализа, достаточности полученного результата.

Таким образом, если выполняется совокупность вышеперечисленных свойств, то это знаний.

Сравнение соз(эс) и классических программных систем

    Сравнение технологий разработки.

      Обычная программа

      Система основанная на знаниях (СОЗ)

    Структура

    Сравнение параметров

Тип системы

Характеристики

Тип обработки

Методы решения задач

Задание шагов решение

Искомое решение

Управление и данные

Модификации

Достоверность информации

Символьная

Эвристический поиск

Удовлетворительное *

Перемешаны

Достоверная + недостоверная

Числовая

Алгоритмический поиск

Оптимальное

Разделены

Достоверная

* удовлетворительное – не хуже, чем человек-эксперт.

Недостоверная информация - ???НЕ-ФАКТОРЫ

Схема решения задач

Основные типы задач, при решении которых, использование соз даёт существенный результат.

Название



Понравилась статья? Поделиться с друзьями: