Исследователи предложили новый подход к обучению искусственного интеллекта (ИИ), который сочетает обучение на данных с использованием фундаментальных правил, таких как законы физики.
Гибридное обучение
Традиционно обучение ИИ основывается на больших объемах данных. Однако модели, основанные исключительно на данных, могут испытывать трудности в новых ситуациях, поскольку им не хватает понимания базовых законов окружающего мира.
Например, ChatGPT может отлично работать с текстами, но сложные логические задачи или задания, связанные с законами физики или математики, ставят ИИ в тупик. Это связано с тем, что ChatGPT обучался на большом массиве текстов. Это сделало из ИИ отличную “говорилку”. Но у узнать правильный ответ на физическую задачу он может только в том случае, если такой ответ встречался где-то в недрах его обучающего материала.
Встраивание человеческих знаний в модели ИИ может повысить их эффективность и способность делать выводы
В новом исследовании ученые создали систему оценки влияния правил на точность модели. Эта система помогает определить наиболее полезные правила и оптимизировать их влияние, отбрасывая избыточные.
Результаты, полученные в области инженерии, физики и химии, показывают, что внедрение правил улучшает работу моделей и позволяет оптимизировать условия проведения экспериментов.
По словам разработчиков, встраивание человеческих знаний в модели ИИ может повысить их эффективность и способность делать выводы, но остается открытым вопрос о том, как сбалансировать влияние данных и знаний. Предложенная система может использоваться для оценки различных знаний и правил для улучшения предсказательных возможностей моделей глубокого обучения.
По словам ученых, модели, основанные на данных, эффективны для решения задач, на которых они были обучены, но плохо адаптируются к изменениям. С другой стороны, модели, основанные на правилах, лучше справляются с новыми ситуациями.
«Мы пытаемся научить модели ИИ законам физики, чтобы они лучше отражали реальный мир, что сделает их более полезными в науке и инженерии», - говорит Юньтянь Чэнь из Восточного технологического института в Нинбо, старший автор исследования.
Объединение данных и правил обеспечивает умеренно точные прогнозы в обоих сценариях, демонстрируя связь между ними.
Исследование сосредоточено на трех основных вопросах:
- Как определить полезность добавляемых правил?
- Какова взаимосвязь между данными и правилами?
- Как улучшить работу правил в машинном обучении?
«Мы обнаружили, что правила имеют разные взаимосвязи, и используем их для ускорения обучения модели и повышения точности», - говорит Чэнь.
По словам ученых, они хотят создать замкнутый цикл, превратив модель в настоящего ученого-ИИ. В данный момент они работают над созданием модели, которая сможет напрямую извлекать знания из данных, а затем использовать эти знания для создания правил и самосовершенствования.
Исследование опубликовано в журнале Nexus.