Современные большие языковые модели (LLM) продемонстрировали революционную производительность в широком диапазоне задач и областей, но у них есть свои ограничения. Эти недостатки можно выявить с помощью теста Beyond the Imitation Game (BIG-Bench, Srivastava et al., 2022), который оценивает LLM…