@@ -18,7 +18,7 @@ class TestKCM(unittest.TestCase):
18
18
19
19
"""
20
20
21
- test_word_list = ['臺灣' , '周杰倫 ' , '韓國瑜 ' , '中興大學' , '肺炎' ]
21
+ test_word_list = ['臺灣' , '蔡英文 ' , '復仇者聯盟 ' , '中興大學' , '肺炎' ]
22
22
23
23
def test_empty (self ):
24
24
self .assertEqual (sim ('' ), [])
@@ -41,23 +41,23 @@ def test_length(self):
41
41
self .assertTrue (len (sim (word )[0 ]) > 1 )
42
42
43
43
def test_example (self ):
44
- example_list = ['日本 ' , '中國大陸 ' , '分佈 ' , '香港 ' , '中國 ' , '群島 ' , '中華民國 ' , '美國 ' , '地區 ' , '臺北市 ' ]
44
+ example_list = ['配音 ' , '香港 ' , '大陸 ' , '日本 ' , '聲演 ' , '日治 ' , '中國大陸 ' , '名稱 ' , '傳統 ' , '地域 ' ]
45
45
overlap = set ([result [0 ] for result in sim ('臺灣' )]) & set (example_list )
46
46
self .assertTrue (len (overlap ) / 10 > 0.7 )
47
47
48
- example_list = ['專輯 ' , '演唱會 ' , '歌曲 ' , '電影 ' , '歌手 ' , '世界 ' , '臺灣 ' , '音樂 ' , '合作 ' , '方文山 ' ]
49
- overlap = set ([result [0 ] for result in sim ('周杰倫 ' )]) & set (example_list )
48
+ example_list = ['總統 ' , '中華民國總統 ' , '民進黨 ' , '主席 ' , '臺灣 ' , '民主進步黨 ' , '時任 ' , '競選 ' , '馬英九 ' , '總統府 ' ]
49
+ overlap = set ([result [0 ] for result in sim ('蔡英文 ' )]) & set (example_list )
50
50
self .assertTrue (len (overlap ) / 10 > 0.7 )
51
51
52
- example_list = ['高雄市 ' , '國民黨 ' , '候選人 ' , '中國國民黨 ' , '高雄 ' , '市長 ' , '總統 ' , '總統候選人 ' , '高雄市市長 ' , '選舉 ' ]
52
+ example_list = ['無限 ' , '電影 ' , '奧創 ' , '紀元 ' , '終局 ' , '漫威 ' , '英雄 ' , '內戰 ' , '美國隊長 ' , '飾演 ' ]
53
53
overlap = set ([result [0 ] for result in sim ('韓國瑜' )]) & set (example_list )
54
54
self .assertTrue (len (overlap ) / 10 > 0.7 )
55
55
56
- example_list = ['大學' , '清華大學 ' , '臺灣' , '成功 ' , '臺灣大學 ' , '臺中 ' , '法商學院' , '性騷擾 ' , '政治 ' , '教授 ' ]
56
+ example_list = ['大學' , '教授 ' , '臺灣' , '畢業 ' , '臺灣省立 ' , '農學院 ' , '法商學院' , '研究所 ' , '合併 ' , '師範大學 ' ]
57
57
overlap = set ([result [0 ] for result in sim ('中興大學' )]) & set (example_list )
58
58
self .assertTrue (len (overlap ) / 10 > 0.7 )
59
59
60
- example_list = ['疫情 ' , '武漢 ' , '新冠 ' , '感染 ' , '冠狀病毒 ' , '因應 ' , '事件 ' , '治療 ' , '逝世 ' , '急性 ' ]
60
+ example_list = ['病例 ' , '新冠 ' , '冠狀病毒 ' , '疫情 ' , '傳染性 ' , '報告 ' , '感染 ' , '武漢 ' , '人數 ' , '患者 ' ]
61
61
overlap = set ([result [0 ] for result in sim ('肺炎' )]) & set (example_list )
62
62
self .assertTrue (len (overlap ) / 10 > 0.7 )
63
63
0 commit comments