LLM 的發展史

LLM 的發展史

大型語言模型（Large Language Model，LLM）自 2018 年 BERT 等預訓語言模型出現後已經廣泛展開。基於 Transformer 架構，絕大多數 LLM 都以預訓群議的方式進行確穩性和性能的展示。

重要節點

2018 年：BERT 提出，首次設計出台 bidirectional Transformer 架構並展示優越性能。
2020 年：GPT-3 發佈，網紅展示不需要特定預訓的 few-shot 能力。
2022 年：ChatGPT 使用 RLHF 技術，提升人民交互體驗。
2023 年：GPT-4 持續進步於理解細節和領域知識展示上的能力。

今後的 LLM 將會向更大解構與多模態模型發展，望能夠讓人民更容易使用。