В настоящее время специалисты по информационным технологиям активно обсуждают концепцию дальнейшего развития сети Интернет. Сеть следующего поколения часто определяют как «Семантическую» (Semantic Web), что подразумевает в большей степени использование машинного поиска и обработки информации. Эта сеть должна быть основана на новых методах, позволяющих легко управлять Web-ресурсами, выстраивать связи между ними и объединять их подобно тому, как выстраиваются связи в реляционных базах данных (БД). За время, прошедшее с момента первой публикации о Semantic Web, был разработан целый ряд стандартов и рекомендаций по обеспечению Semantic Web. Сеть продолжает развиваться — появляются новые стандарты, но главными задачами, стоящими перед сообществом Семантической Сети, остаются создание специализированных онтологий.
Специализированные (предметно-ориентированные) онтологии (онтологии предметных областей) — это представление какой-либо области знаний или части реального мира. В такой онтологии содержатся специальные для этой области значения терминов. Создание онтологий - один из наиболее сложных аспектов построения семантической сети и разработка любой онтологии должна опираться на опыт и знания специалистов в соответствующей области.
Разработка онтологий, подразумевающих переход к семантически значимому представлению информации, является ведущим направлением развития информационных технологий вообще и особенно в специализированных областях знаний, отличающихся терминологическим разнообразием и спецификой терминообразования. Это особенно характерно для научной области, где терминологическое обеспечение научного знания обеспечивается международными научными организациями. Так, онтология аналитической химии должна обеспечить в абстрактном виде иерархию понятий аналитической химии и связей между ними. Онтологии должны стать своего рода «ключом» для каталогизации информации (в том числе и знаний) с целью обеспечения их адекватного поиска в различных информационных средах, включая и Интернет.
В качестве важного шага в направлении создания онтологии разработан многоязычный тезаурус ключевых терминов по общим вопросам и метрологии аналитической химии в виде многотабличной реляционной базы данных (MS SQL). Показано, что реляционная модель позволяет адекватно представлять взаимосвязи сущностей. В настоящее время тезаурус содержит около двухсот пятидесяти понятий, более одной тысячи ста терминов, около пятисот шестидесяти дефиниций и много другой вспомогательной информации. Впервые терминология из разных официальных документов (ISO, IUPAC и ГОСТ и др.) интегрирована на семантической основе в общем электронном хранилище. Тезаурус, в отличие от глоссария, несет дополнительную семантическую функцию, определяя связи между терминами. Для разработанного тезауруса свойственны следующие взаимосвязи: родовидовые отношения терминов (отношения «выше-ниже» или иерархические), симметричная ассоциация понятий (очень близкие, но разные понятия), синонимия. Наиболее многочисленная группа родовидовых отношений строится автоматически с помощью разработанной программы ThesaurusAnalysis (язык программирования C#). Проведен анализ родовидовых отношений терминологии с целью генерирования иерархии терминов. Анализ иерархии терминов позволяет выявить неточности терминологии и дать рекомендации по их устранению (например, необходимость уточнения дефиниций терминов). Дефиниции терминов, описывающих понятия более высокого порядка, должны включать базовые термины тезауруса, а не являться произвольным текстом, даже близким по смыслу. Термины разделены на ряд категорий (дескрипторы понятий, наборы синонимов различной близости, антонимы и др.).
Разработанный тезаурус опубликован в Интернете для ознакомления и обсуждения профессиональным сообществом химиков-аналитиков и в образовательных целях. Этот ресурс, по сути, является полноценной онтологией лексического уровня, впервые разработанный в области аналитической химии. Представлены понятия тезауруса, все рекомендованные термины (включая их дефиниции и статус), в том числе на английском и русском языках.