NLP-文本向量化:WordEmbedding一般步骤【字符串->分词->词汇序列化...
NLP-⽂本向量化:WordEmbedding⼀般步骤【字符串->分词->词汇序列化->词。。。⼀、字符串⽂本的序列化在word embedding的时候,不会直接把⽂本转化为向量,⽽是先转化为数字,再把数字转化为向量,那么这个过程该如何实现呢?这⾥我们可以考虑把⽂本中的每个词语和其对应的数字,使⽤字典保存,同时实现⽅法把句⼦通过字典映射为包含数字的列表。实现⽂本序列化之前,考虑以下⼏点:1. 如...
2023-11-06 30 0