Современные большие языковые модели (LLM) продемонстрировали революционную производительность в широком диапазоне задач и областей, но у них есть свои ограничения. Эти недостатки можно выявить с помощью теста Beyond the Imitation Game (BIG-Bench, Srivastava et al., 2022), который оценивает LLM…
Команда Google и Стэнфорда применяет цепочку размышлений, побуждая превзойти человеческую производительность в…
schedule
21.04.2024