Cyan's Blog

Search

Search IconIcon to open search

D2L-50-语言模型-传统模型的不足

Last updated Mar 8, 2022 Edit Source

# 语言模型

2022-03-08

Tags: #LanguageModel

# 传统模型

不幸的是,由于连续单词对“deep learning”的出现频率要低得多, 所以估计这类单词正确的概率要困难得多。 特别是对于一些不常见的单词组合,要想找到足够的出现次数来获得准确的估计可能都不容易。 而对于三个或者更多的单词组合,情况会变得更糟。 许多合理的三个单词组合可能是存在的,但是在数据集中却找不到。 除非我们提供某种解决方案,来将这些单词组合指定为非零计数, 否则将无法在语言模型中使用它们。 如果数据集很小,或者单词非常罕见,那么这类单词出现一次的机会可能都找不到。1

# 拉普拉斯平滑

# 缺点


  1. 8.3. 语言模型和数据集 — 动手学深度学习 2.0.0-beta0 documentation ↩︎

  2. 8.3. 语言模型和数据集 — 学习语言模型 ↩︎