写在开始:对SpringBoot学习理解,为本人一个五年的小java,本人利用空余时间,自学摸索SpringBoot的总结渗透,及以我个人的角度叙说过程中的教训、心得、经验,学术未精,尚处于应用层面,但会不断更新积累!
个人对SpringBoot的理解:
第一、在微服务大行其道的今天,SpringBoot还集成了应用服务器如tomcat、jetty等,真正做到了快速开发,独立部署。
第二、SpringBoot整合了Spring系的众多框架,并默认配置了很多配置文件,简化了使用者使用Spring系框架时需要面对的众多配置文件和jar包兼容问题;
因此,我们得创建一个普通的 Spring Boot工程,不赘述了,
引入 HanLP数据 和 配置
下载完成以后,首先解压 hanlp-release.zip压缩包,然后将解压出的 HanLP的 jar包引入 Spring Boot工程,然后需要来放置 HanLP所需配置和数据:
将解压后 hanlp-release.zip压缩包中的 hanlp.properties配置文件置于项目的 resources资源目录下
然后解压 data.zip压缩包,将解压出的 data目录同样至于 resources目录下( data 中的数据包很重要,是 HanLP工作所需的词典和模型 )
创建 IO适配器
HanLP 提供了 IO适配器,用户可以实现其提供的 com.hankcs.hanlp.corpus.io.IIOAdapter 接口以在不同的平台(HDFS、Redis等)上运行HanLP,默认的 IO适配器 IOAdapter = com.hankcs.hanlp.corpus.io.FileIOAdapter 是基于普通文件系统的。
接下来我们重写一下 IOAdapter类,使用读写静态资源文件的方法来读取HanLP所需的词典和模型数据( 即resources目录下刚放置的 data目录 )
然后我们配置一下 HanLP的配置文件hanlp.properties,有两处需要改为以下配置:
好,现在项目就可以工作了,我们接下来写几个测试用例测试体验一把 !
实验测试
随便写几个例子来感受一番:
分词功能
分词结果如下:
每个词段后的 /nx,/w之类的是 HanLP定义的词性,可以去看 HanLP的接口来获取详情
文本推荐
三个关键字的语句推荐结果为:
关键字提取
提取结果为:
体验一番我们发现其自带的模型、字典等数据给出的实验效果已经是非常不错了,而且用户还可以自定义或修改 data目录下的模型、字典等数据来满足特定需求,因此还是十分强大的。
上面是我个人对SpringBoot的理解和分析,若有讲诉过程,出现有错误或没有表达清楚部分,还请大家批评及指出,希望跟大家一起学习、成长!
文章出处:CodeSheep