千家论坛--智能建筑-智慧安防-智慧社区-智能家居论坛

人工智能
收藏本版 (4) |订阅

人工智能 今日: 2813 |主题: 1057|排名: 24 

发新帖

如何编译运行HanLP自然语言处理包...

[复制链接]
hadoop小学生 发布于: 2019-3-6 13:05 106 次浏览 0 位用户参与讨论
跳转到指定楼层

master分支
对于master分支,编译方法如下:
git clone  github.com/hankcs/HanLP.git
mvn install -DskipTests
·由于目前一些test不够规范,使用了硬编码路径下的资源,所以暂时跳过单元测试。
·该方法不会将src/main/resources目录下的任何资源(包括hanlp.properties)打包进jar,如果需要打包资源文件,请切换到portable分支。
portable分支
git checkout portable
然后将需要的data放入src/main/resources,最后执行:
mvn install -DskipTests
运行jar
目前jar包中有一些模块可以命令行执行,以感知机词法分析器为例。由于这些模块一般需要加载外部data,所以需要在运行时指定hanlp.properties。运行时,一个典型的目录结构如下:
·此处只列出了重要的目录。
·一个良好的实践是把hanlp.properties放到resources目录下。
命令行需要指定jar包和hanlp.properties所在的目录:
$ java -cp target/hanlp-1.6.0.jar:src/main/resources  com.hankcs.hanlp.model.perceptron.Main -test \
<<< '华安集团胡花蕊来到纽约艺术博物馆参观'
[华安/nz 集团/n]/nt 胡花蕊/nr 来到/v [纽约/ns 艺术/n 博物馆/n]/ns 参观/v
·Windows用户请使用分号java -cp target/hanlp-1.6.0.jar;src/main/resources

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆 千家通行证登陆

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆 千家通行证登陆

本版积分规则

千家智客微信号
千家智客微信
玩物说商城
玩物说商城