当前位置: 首页 >
【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
西集镇
什么是你去了台湾才知道的事?
为什么鸿蒙PC要排斥Linux生态?
为什么部分人对《大明王朝 1566》中芸娘嗤之以鼻?
湖村镇
巅峰期的成龙身体素质是怎么一种存在?
如何进入开源软件世界提升自己?
白砂镇
为啥 php 还有这么多人在用啊?
江西女生怎么结婚?
沙市镇
OpenAI 宣布使用 AMD 的 MI300 X 和 MI450 芯片,这两款芯片在技术上有何亮点?
obsidian用一两年后会有多大?全文搜索还快吗?
桂平市
启用哪一个DNS网速最快?
印度为什么一定要和中国作对?
华胥镇
如何评价前端组件库shadcn/ui?
如何看待CCTV13批评“L2.999智驾”等误导性宣传,若导致事故车企可能需要担责?
友情链接