Description du livre
Ce livre présente une étude sur la distribution par corpus comme principale méthode de prédiction, se concentrant sur les caractéristiques sémantiques individuelles pour prédire les sens de mots non définis en utilisant des corpus et des outils, tels que le corpus chinois Gigaword, HowNet, Chinese Wordnet, et XianDai HanYu CiDian (Xian Han). A l'aide de ces corpus, l'étude détermine les grappes de collocation de quatre mots cibles : chi1 "manger", wan2 "jouer", huan4 "changer" et shao1 "brûler" par des similitudes de caractère et de concept. Les résultats de cette étude de prédiction des sens démontrent qu'elle a été en mesure d'utiliser des tâches hors ligne pour tester l'intuition de certains participants, ce qui appuie la théorie selon laquelle différents groupes peuvent représenter différents sens dans le cadre d'une approche fondée sur un corpus et sur le calcul.