词频统计

我们以第六次结集的全巴利文献进行了统计,得出这样的一些统计结果

  1. 23个词我们熟悉,超过20%的三藏我们熟悉
  2. 100个词我们熟悉,超过30%的三藏我们熟悉
  3. 300个词我们熟悉,超过40%的三藏我们熟悉
  4. 900个词我们熟悉,超过50%的三藏我们熟悉

因为记忆是存在遗忘规律的,只有多次重复出现的词,我们才能更好的记忆。 显然我们可以得出这样的结论:

  • 高频词:即便不去刻意记忆,因为多次重现,所以自然忘不了——不用背
  • 低频词:即便刻意去记忆,因为很少重现,所以自然记不住——背了也没用

综上,学习巴利不用背单词。 如果真的想背单词,依照词频统计表(前4000)背单词。

统计结果

排名单词源型词频占比(%)巴利文献累计覆盖率(%)
1ta3521373.493.5
2ca1802071.7865.3
3na1701741.6877
4va1256471.2458.2
5hoti1207281.1979.4
6ayaṃ1081081.07210.5
7ya1015731.00711.5
8bhikkhu816710.8112.3
9dhamma810090.80313.1
10pana784430.77813.9
11amha698940.69314.6
12tattha546750.54215.1
13evaṃ543530.53915.6
14pa527310.52316.2
15ka525740.52116.7
16vutta522480.51817.2
17nāma516970.51217.7
18kha512930.50818.2
19karoti496340.49218.7
20bhagavant424430.42119.1
21attha409440.40619.5
22hi404650.40119.9
23eka366980.36420.3
排名单词源型词频占比(%)巴利文献累计覆盖率(%)
81saddhiṃ97710.09729
82viharanta95150.09429.1
83pañca94740.09429.2
84paṭhama94390.09429.3
85punāti94390.09429.4
86gacchanta94080.09329.5
87bhavant92870.09229.6
88sati90260.08929.7
89vacana88730.08829.8
90vaṭṭanta88030.08729.9
91taya87490.08729.9
92nava86250.08530
93aṭṭha86150.08530.1
94aññā84980.08430.2
95ṭhita84320.08430.3
96kāla82740.08230.4
97ida82720.08230.4
98purisa81900.08130.5
99sattha81380.08130.6
100sukha81110.0830.7
排名单词源型词频占比(%)巴利文献累计覆盖率(%)
290aññamañña31410.03139.7
291seyyathāpi31410.03139.7
292sāriputta31350.03139.8
293puñña31190.03139.8
294pāpuṇāti30860.03139.8
295āhāra30490.0339.9
296bhāveti30420.0339.9
297puccha30190.0339.9
298pañha30170.0339.9
299divasa29940.0340
300sabbati29810.0340
排名单词源型词频占比(%)巴利文献累计覆盖率(%)
890samagga10250.0149.9
891samattha10250.0149.9
892nivāseti10230.0149.9
893bhinna10230.0149.9
894satta10200.0149.9
895pavāraṇā10190.0149.9
896samāpanna10180.0149.9
897pahīyati10170.0150
898anuloma10170.0150
899niddesa10140.0150
900asaṅgahita10140.0150
文 章 目 录