Сохранение медицинских онтологий с помощью формальной логики: история предостережений и надежд для классического ИИ
3 января 2024 г.База знаний или LLM
Что, если бы мы могли создать цифровой реестр всех человеческих знаний, энциклопедию, но упорядоченную таким образом, чтобы можно было ответить на сложные вопросы? Я слышу, как вы кричите: «Разве это не похоже на степень магистра права, обученную в Википедии?»
Что-то вроде… За исключением того, что такой LLM сам создал бы инвентарь, оставив связи между фактами непрозрачны. Это происходит потому, что все входные текстовые данные, подаваемые в LLM, неструктурированы и обрабатываются на равных основаниях. Это механизм внутреннего внимания, который начинает организовывать текст. Таким образом, хотя мы можем задавать сложные запросы в форме естественного языка и получать ответ на том же носителе, нам не доступен запас знаний. Это как если бы LLM дал пресс-конференцию, но после первого раунда оставил бы нас без ответа: «Больше никаких вопросов».
Это лучше, чем вообще не иметь возможности выполнять запросы? Что ж, это действительно неправильное восприятие игрового поля. Выбор не стоит между магией запросов в стиле LLM и ничем вообще. Выбор стоит между магией запросов, подобной LLM, и неполными, но тщательно созданными базами знаний (поисковые системы могут отвечать на запросы, но делают это, указывая на документы в Интернете, а не предоставляя ответ сами). Если воспользоваться предыдущей аналогией с пресс-конференцией, то выбор стоит между тем, чтобы выслушать представителя с обширным словарным запасом, и опросом реальных действующих лиц, рискуя вернуться домой с пустыми руками.
Медицинская онтология, раскрывающая ограничения LLM.
Фундаментальная модель анатомии (ФМА) является такой попыткой создать инвентарь человеческих знаний, в данном конкретном случае, всех знаний, связанных со структурной организацией человеческого тела на микро- и макроскопическом уровнях. На первый взгляд бесспорным выбором фундаментального отношения для использования в этой базе знаний является партономическое отношение включения. Например, цитоплазма часть_клетки. Маленький спойлер… такое разделение концептуального пространства не решает проблему (каламбур). Я объясню вам, почему. Однако давайте сначала сосредоточимся на том, что это означает в обсуждаемом здесь более широком контексте.
Мы гордимся тем, что у нас есть степени LLM, которые могут помочь нам в копании в огромных объемах знаний, удобно игнорируя тот факт, что у нас нет реального понимания того, как факты связаны внутри модели, в то время как наши собственные попытки связать факты самым строгим образом потерпели неудачу. оказались предательскими усилиями. Пресс-конференция создает впечатление, что мы получили достоверные ответы, хотя даже сами действующие лица не могут толком вспомнить, что произошло. Если мы являемся членом комитета по связям с общественностью, это может нас не слишком беспокоить, но как гражданин, заинтересованный в поддержании либеральной демократии, я, возможно, не захочу слишком сильно полагаться на такие отчеты.
Партономное включение пошло не так
Как же такая, казалось бы, невинная и простая связь, как партономное включение, может быть настолько обманчивой?
Вот несколько, казалось бы, бесспорных примеров таких отношений:
яички человека являются частью человеческого существа
Да, но есть люди мужского и женского пола. Итак, каждое человеческое яичко принадлежит (или принадлежало, если человек попал в маловероятную аварию) человеку, но не у каждого человека есть человеческое яичко.
Решение?
Отношения part_of разделены на две подотношения: has_part и part_for. Итак, теперь мы можем заявить, что человеческое яичко является частью человеческого существа, не привязываясь к человеку, и имеет часть человеческого яичка. Отношение part_of сохраняется как соединение этих двух подотношений: A part_of B =def A part_for B & B имеет_часть A.
репликационная вилка часть_нуклеоплазмы
Да, но только в определенные моменты цикла репликации клеток (т. е. S-фазы).
Читать по биологии: https://www.nature.com /scitable/topicpage/replication-fork-stalling-and-the-fork-protection-14435782/
Решение?
На первый взгляд кажется, что есть как минимум два возможных выхода. Во-первых, мы могли бы ввести мереологические отношения, зависящие от времени или фазы. Таким образом, part_of может получить индекс времени, чтобы различать разные моменты времени, в которые получается связь. Однако, поскольку цикл репликации клеток состоит из четко определенных фаз, логически более уместно ввести фазозависимые партономные отношения включения. Во-вторых, вместо того, чтобы возиться с самими отношениями, мы можем обогатить репрезентативную способность релятов (т. е. связанных вещей). Итак, репликационная вилка — это не просто репликационная вилка, и нуклеоплазма не всегда одна и та же сущность. Партономное включение репликационной вилки в нуклеоплазму во время S-фазы можно представить следующим образом: часть репликационной вилки_нуклеоплазмы_S.
синаптонемный комплекс часть_хромосомы
Да, но не во всех случаях. Например, у простейших инфузорий для спаривания гомологичных хромосом не требуется образование синаптонемного комплекса.
Читать по биологии: https://pubmed.ncbi.nlm.nih.gov/24336924/
Решение?
В этом случае прибегают к помощи вспомогательных аксиом, которые определяют логические отношения между имеющимися фундаментальными мереологическими отношениями. Если мы хотим представить «часть» как «может быть частью», то мы можем ввести менее фундаментальное отношение part_of_can, определив его как экзистенциальное отношение импорта: A part_of_can B =def ∃C( C есть_B и A часть_C). Итак, в этом конкретном примере у нас будет синаптонемный комплекс part_of_can хромосомы, то есть существует некоторая хромосома, частью которой является синаптонемный комплекс. Внимательный читатель увидит здесь альтернативное решение, похожее на предложенное ранее. Действительно, вместо того, чтобы вводить вторичные отношения, можно придерживаться фундаментальных отношений и представлять факты путем демультиплексирования относящихся. Таким образом, факт «синаптонемная комплексная часть_хромосомы_Animalia» будет частью базы знаний, но не факт «синаптонемная комплексная часть_хромосомы_Ciliophora».
Заключение
Короче говоря, хорошо продуманные отношения prima facia необходимо разбить и определить в более примитивных терминах или потребовать вспомогательных аксиом, чтобы отразить сложность реальности, которую человек желает представить. Более того, эти решения находятся в противоречии с решениями, которые предпочитают реляционную и дефиниционную экономию за счет увеличения мощности сущности. Поскольку эти проблемы возникают в медицинских онтологиях, разработанных профессионалами, должно быть ясно, что эта задача ни при каких обстоятельствах не является легкой. Это подчеркивает запутанную двойную связь между, с одной стороны, тонкостью реляционной композиции реальности, и, с другой стороны, гибкостью естественного языка, позволяющей сжимать и сжимать эти чудесные детали в коммуникативные стволы.
Как же это понимание повлияет на состояние современного игрового поля ИИ? Если мы стремимся к точности представления, классический ИИ или возрождение его основных идей все еще могут сыграть свою роль в парадигмах глубокого обучения. И наоборот, если мы стремимся к плавности общения, LLM на самом деле мог бы уловить именно то, что мы хотим… если бы не тот факт, что мы, люди, сами уже овладели навыками человеческого языка, так что LLM стал тем, чем в сравнении являются секс-куклы. к настоящей близости.
Источники
Документ, на котором основана эта статья: Бэри Смит и Корнелиус Росс - Роль фундаментальных отношений в согласовании биомедицинских онтологий: https://pubmed.ncbi.nlm.nih.gov/15360852/
Оригинал