<div dir="ltr">大家好,<br>由於前面所提供數據與目前提供給范博士模型對於錯誤處理方式不太一樣,<br>因此這邊提供正確文本及模擬語音辨識文本混在一起測試的結果。<br>本次實驗結果,皆有加入偵測、MASK及NER資訊。<br><br><table style="width:881px"><colgroup><col style="width:153px"><col style="width:178px"><col style="width:172px"><col style="width:193px"><col style="width:185px"></colgroup><tbody><tr><td style="background-color:rgb(205,230,249);border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>FGC_release_data</div></td><td style="background-color:rgb(205,230,249);border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>train+fake_train</div></td><td style="background-color:rgb(205,230,249);border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>dev+fake_dev</div></td><td style="background-color:rgb(205,230,249);border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>test+fake_test</div></td><td style="background-color:rgb(205,230,249);border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>ss_test+fake_ss_test</div></td></tr><tr><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>org</div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>0.010874374546470587</div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>0.010152058157778249</div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>0.010700569038816044</div><div><br></div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div>0.01031970650538047</div></td></tr><tr><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div><span style="font-weight:bold">Model</span></div><div><span style="font-weight:bold">+MASK+NER+check_ASR</span></div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div><b>0.009442390398815247</b></div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div><b>0.00871901437444052</b></div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div><b>0.009715503291662882</b></div></td><td style="border-width:1px;border-style:solid;border-color:rgb(204,204,204)"><div><b>0.009293596352095927</b></div></td></tr></tbody></table><br>佳樺敬上</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">吳佳樺 <<a href="mailto:60447070s@gapps.ntnu.edu.tw">60447070s@gapps.ntnu.edu.tw</a>> 於 2020年4月7日 週二 下午2:34寫道:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">大家好,<br>目前語音辨識錯誤修正的實驗已調整到目前最好的模型,並且加入判斷是否為語音辨識輸出結果,修正前,針對英文、數字及中文數字做MASK,修正完畢之後,再回復文本中的 英文、數字及中文數字,最後將用NER資訊檢查修正結果。目的保證文章中的,數字、英文及專有名詞都不會因為修正模型做任何錯誤修改。<br><br>目前實驗結果,在完全正確的文本上的效能(Word Error Rate)為:<br>FGC_train: <div><ul><li style="margin-left:15px">  org:   0  <br></li><li style="margin-left:15px">cor:   0.00018594282023843658 </li></ul><div>FGC_dev:</div><div><ul><li style="margin-left:15px">org:   0 </li><li style="margin-left:15px"> cor:   0.0000897111860860755<br></li></ul>FGC_test:</div><div><ul><li style="margin-left:15px">org:   0 </li><li style="margin-left:15px"> cor:   0.000259740259740259<br></li></ul></div><div>FGC_ss_test: <br></div><div><ul><li style="margin-left:15px">org:   0</li><li style="margin-left:15px"> cor:   0.00027056277056277<br></li></ul></div><div>在我所產生的模擬錯誤文本上未使用NER資訊的效能(Word Error Rate)為:<br>FGC_train: </div><div><ul><li style="margin-left:15px">org:  0.021748749092941173<br></li><li style="margin-left:15px">cor:  0.020160168661298827<br></li></ul></div><div><div>FGC_dev: </div><div><ul><li style="margin-left:15px">org:  0.020304116315556498<br></li><li style="margin-left:15px">cor:  0.020070100445681357<br></li></ul>FGC_test: </div><div><ul><li style="margin-left:15px">org:  0.02140113807763209<br></li><li style="margin-left:15px">cor:  0.021487314618834033<br></li></ul></div><div>FGC_ss_test: </div></div><div><ul><li style="margin-left:15px">org:  0.02063941301076094<br></li><li style="margin-left:15px">cor:  0.020729180241179628<br></li></ul></div><div>目前來看,整體上都有變好,為預防決賽的文本和之前文本差異太大,我針對Bert給出機率做了一個調整,若Top-1分數很低,我將不做任何修正。<br><br>以上是語音辨識錯誤修正目前的實驗結果。感謝!<br><br>佳樺敬上</div></div></div>
</blockquote></div>