Skip to content
Awesome LLM Learning
搜索文档
K
Main Navigation
首页
深度学习基础
NLP基础
LLM基础
LLM推理
LLM应用
前沿分享
GitHub
Appearance
Menu
Return to top
目录
大模型涌现分析
大模型涌现能力探讨:大型语言模型的涌现能力是幻象吗?
探索大语言模型表现出涌现能力的原因,初步结论是涌现能力主要是由研究人员选择一个非线性或不连续的评价指标导致的,另外探索了如何诱导涌现能力的出现,本文在视觉任务上通过对评价指标的修改复现了涌现现象。
大语言模型知识蒸馏
Fine-tune-CoT
: 旨在利用非常大的语言模型 (LMs) 的CoT推理能力来教导小模型如何解决复杂任务,蒸馏出来的小模型在某些数据集上精度甚至能超过 teacher 大模型