22306班
未读
30.5月8日 项目:利用hanlp实现热门评论内容分词并绘制词云
本项目预期结果: 项目:利用hanlp实现热门评论内容分词并绘制词云 利用上节课简易的框架 import hanlp
tok = hanlp.load(hanlp.pretrained.tok.COARSE_ELECTRA_SMALL_ZH)
r=tok("你好,我是现代职业技术学校学生&quo
22306班
未读
29.5月8日 项目: 实现分词
分词 什么是分词 分词(Tokenization)是自然语言处理(NLP)中的一个基本步骤,它涉及将文本数据分解成更小的单元,通常是单词、短语或其他有意义的元素,这些单元被称作“词元”(tokens)。分词的目的是让计算机能够更好地理解和处理文本信息。以下是分词的一些关键点: 文本分解:将文本字符串