1.首先在网站上面下载gensim,我是在11服务器上面下载的

2.使用winpython打开

3.在command windows 下使用pip install gensim这句话进行,原先使用这句话pip install -U gensim进行安装发生了各种纠结的错误

4。由于语料库太大了,就是用了师兄提炼好的部分wiki.en.txt进行训练

5.在train_word2vec_model中将

"""if len(sys.argv) < 4:

print globals()['__doc__'] % locals()

    sys.exit(1)

   """

修改为

  inp = "wiki.en.text "

  outp1 = "wiki.en.text.model"

  outp2 = "wiki.en.text.vector"

后直接进行运行,(运行直接点击F5进行),

或者是可以不用修改代码直接使用run configure来进行(在run configure中command line option 中填写那3个参数,确定后直接点击F5进行运行)

这里的训练过程是很浪费时间的

处理43M的小的语料库花费了1个小时10分钟

387M的小语料库花费了10个小时

得到的一些结果举例

baghdad(伊拉克的首都)

england london
  baghdad

england-london=x-baghdad

model.similarity('woman', 'woman')
0.99999999999999989

最新文章

  1. MVC采用Jquery实现局部刷新
  2. MVC Razor语法
  3. 安装并配置前端自动化工具——grunt
  4. CSS-position详解
  5. eclipse javascript验证报错
  6. .net DataTable 正确排序姿势
  7. Windows Azure入门教学系列 (二):部署第一个Web Role程序
  8. project文件问题
  9. Java Web 单表操作
  10. 理解SSL/TLS协议
  11. maven工程 java 实现文件上传 SSM ajax异步请求上传
  12. 180815 Python自学成才001
  13. [NOIp2018提高组]货币系统
  14. vue中如何动态的绑定图片,vue中通过data返回图片路径
  15. 【转载】和 Thrift 的一场美丽邂逅
  16. Request.UrlReferrer注意点
  17. How to Get Text inside a Canvas using Webdriver or Protractor
  18. Spark与Flink大数据处理引擎对比分析!
  19. pfsense的nat配置
  20. C# RSA加解密和MD5加密

热门文章

  1. VS2008 运行VC\Bin下的link.exe, cl.exe, lib.exe提示找不到mspdb80.dll的解决方法
  2. SGU 0438 The Glorious Karlutka River =) 动态流
  3. 杜教的AAA树
  4. Geeks Interview Question: Ugly Numbers
  5. java--字节数组输入、输出流
  6. WINDOWS OPTIMIZE
  7. RTX51 Tiny实时操作系统学习笔记—初识RTX51 Tiny
  8. 解密UML九中关系
  9. iOS中block实现的探究
  10. REST、SOA、SOAP、RPC、ICE、ESB、BPM知识汇总及理解