Исследователи из Нанкинского аграрного университета представили SINONG — первую открытую отраслевую LLM-модель, ориентированную на задачи сельского хозяйства
Проект размещён в открытом доступе на GitHub, а его запуск китайские СМИ описывают как важный шаг в развитии прикладного ИИ для аграрного сектора.
SINONG обучалась на масштабном массиве специализированных данных и должна помочь в разработке ИИ-сервисов для решения прикладных задач агробизнеса и ускорения научно-исследовательской работы.
Как работает LLM
Новая модель обучалась на масштабном и структурированном массиве отраслевых данных: 8 863 книги, 243 897 научных публикаций, 196 748 документов и отраслевых материалов, а также обширном массиве данных из открытых интернет-источников.
А вы знали, что название SINONG (кит. 司农) отсылает к древнекитайской должности чиновника, отвечавшего за сельское хозяйство и финансы.
Общий объём обучающей базы, по данным проекта, превышает 4 млрд токенов.
Разработчики уделили внимание снижению рисков «галлюцинаций» и устаревания знаний.
Для этого данные собирались из разных источников, проходили отбор и интеграцию, а при обучении использовались не только стандартные инструкционные примеры, но и цепочки рассуждений, а также контекстные ссылки.
Источники утверждают о 98% точности ответов нового решения, однако сами разработчики не комментировали данную информацию.
По данным отраслевых публикаций, SINONG доступна в версиях 8B и 32B параметров. Это значит, что её потенциально можно адаптировать под различные локальные задачи.
Например, консультации для агрономов, обучение студентов, составление документов, поддержку селекционных программ или создание ассистентов.
Что дальше?
Создатели разработки заявили, что открытая публикация модели должна снизить барьеры для внедрения ИИ в сельском хозяйстве и упростить дальнейшую разработку решений для отрасли.
Такие системы уже рассматриваются как инструмент для консультаций по болезням и вредителям, анализа, оптимизации процессов в растениеводстве и животноводстве, а также обучения специалистов.
Однако их внедрение по-прежнему требует качественных данных, инфраструктуры, защиты информации фермеров и экспертного контроля рекомендаций.