2018-11-02 11:39

  写在开始:对SpringBoot学习理解,为本人一个五年的小java,本人利用空余时间,自学摸索SpringBoot的总结渗透,及以我个人的角度叙说过程中的教训、心得、经验,学术未精,尚处于应用层面,但会不断更新积累!

  1541129015117402.png

  个人对SpringBoot的理解:

  第一、在微服务大行其道的今天,SpringBoot还集成了应用服务器如tomcat、jetty等,真正做到了快速开发,独立部署。

  第二、SpringBoot整合了Spring系的众多框架,并默认配置了很多配置文件,简化了使用者使用Spring系框架时需要面对的众多配置文件和jar包兼容问题;

  因此,我们得创建一个普通的 Spring Boot工程,不赘述了,

  引入 HanLP数据 和 配置

  下载完成以后,首先解压 hanlp-release.zip压缩包,然后将解压出的 HanLP的 jar包引入 Spring Boot工程,然后需要来放置 HanLP所需配置和数据:

  将解压后 hanlp-release.zip压缩包中的 hanlp.properties配置文件置于项目的 resources资源目录下

  然后解压 data.zip压缩包,将解压出的 data目录同样至于 resources目录下( data 中的数据包很重要,是 HanLP工作所需的词典和模型 )

  创建 IO适配器

  HanLP 提供了 IO适配器,用户可以实现其提供的 com.hankcs.hanlp.corpus.io.IIOAdapter 接口以在不同的平台(HDFS、Redis等)上运行HanLP,默认的 IO适配器 IOAdapter = com.hankcs.hanlp.corpus.io.FileIOAdapter 是基于普通文件系统的。

  接下来我们重写一下 IOAdapter类,使用读写静态资源文件的方法来读取HanLP所需的词典和模型数据( 即resources目录下刚放置的 data目录 )

  1541129101271383.png

  然后我们配置一下 HanLP的配置文件hanlp.properties,有两处需要改为以下配置:

  1541129154436022.png

  好,现在项目就可以工作了,我们接下来写几个测试用例测试体验一把 !

  实验测试

  随便写几个例子来感受一番:

  分词功能

  1541129203357841.png

  分词结果如下:

  1541129264755277.png

  每个词段后的 /nx,/w之类的是 HanLP定义的词性,可以去看 HanLP的接口来获取详情

  文本推荐

  1541129335526802.png

  三个关键字的语句推荐结果为:

  1541129384867208.png

  关键字提取

  1541129431820383.png

  提取结果为:

  1541129542291207.png

  体验一番我们发现其自带的模型、字典等数据给出的实验效果已经是非常不错了,而且用户还可以自定义或修改 data目录下的模型、字典等数据来满足特定需求,因此还是十分强大的。

  上面是我个人对SpringBoot的理解和分析,若有讲诉过程,出现有错误或没有表达清楚部分,还请大家批评及指出,希望跟大家一起学习、成长!

   文章出处:CodeSheep


评论