Исследование Anthropic: как управлять мыслями LLM
Обычно модели AI воспринимаются как «черный ящик», где ввод данных приводит к выводу ответа, но неясно, почему модель выбрала именно этот ответ. Есть разные гипотезы, объясняющие, что происходит внутри AI. Мы уже рассказывали о том, что происходит «под капотом» ChatGPT с теоретической точки зрения, однако исследователи из Anthropic пошли дальше: они нашли закономерности в понимании внутренней работы больших языковых моделей (LLM) и смогли управлять ими.
Обычно модели AI воспринимаются как «черный ящик», где ввод данных приводит к выводу ответа, но неясно, почему модель выбрала именно этот ответ. Есть разные гипотезы, объясняющие, что происходит внутри AI. Мы уже рассказывали о том, что происходит «под капотом» ChatGPT с теоретической точки зрения, однако исследователи из Anthropic пошли дальше: они нашли закономерности в понимании внутренней работы больших языковых моделей (LLM) и смогли управлять ими.