前言

以前在 github 上自己开源了一些项目。碍于技术与精力,大部分项目都是 java 实现的。

这对于非 java 开发者而言很不友好,对于不会编程的用户更加不友好。

为了让更多的人可以使用到这些简单的小工具,周末抽时间将几个开源项目添加了 web 服务实现。

开源项目

中文繁简体转换

简介:支持中文繁简体的在线转换。

在线地址:https://houbb.github.io/opensource/opencc4j/

开源地址:https://github.com/houbb/opencc4j

用法简介

此处仅选择一个作为例子介绍,其他用法大同小异。

【处理】将左边的内容,按照下拉框的选择,结果会自动填充在右边。

【互换】互换左右两边的内容。平时测试繁体=》简体,和简体=》繁体更加方便。

【复制】复制右边的内容到粘贴板。

敏感词

简介:基于 DFA 算法实现的高性能 java 敏感词工具框架。请勿发布涉及政治、广告、营销、FQ、违反国家法律法规等内容。

在线地址:https://houbb.github.io/opensource/sensitive-word/

开源地址:https://github.com/houbb/sensitive-word

拼音

简介:高性能中文转拼音工具。支持同音字。

在线地址:https://houbb.github.io/opensource/pinyin/

开源地址:https://github.com/houbb/pinyin

可以很方便的把一段文字转换为对应的拼音,比如前言的内容默认如下:

yǐ qián zài github shàng zì jǐ kāi yuán le yī xiē xiàng mù 。 ài yú jì shù yǔ jīng lì , dà bù fèn xiàng mù dōu shì java shí xiàn de 。 zhè duì yú fēi java kāi fā zhě ér yán hěn bù yǒu hǎo , duì yú bú huì biān chéng de yòng hù gèng jiā bù yǒu hǎo 。 wèi le ràng gèng duō de rén kě yǐ shǐ yòng dào zhè xiē jiǎn dān de xiǎo gōng jù , zhōu mò chōu shí jiān jiāng jǐ gè kāi yuán xiàng mù tiān jiā le web fú wù shí xiàn 。

分词

简介:基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现。

在线地址:https://houbb.github.io/opensource/segment/

开源地址:https://github.com/houbb/segment

分词,可以说是 NLP 的基石。

前言的内容分词效果如下:

[以前[0,2), 在[2,3),  [3,4), github[4,10),  [10,11), 上自[11,13), 己[13,14), 开源[14,16), 了[16,17), 一些[17,19), 项目[19,21), 。[21,22), 碍于[22,24), 技术[24,26), 与[26,27), 精力[27,29), ,[29,30), 大部分[30,33), 项目[33,35), 都[35,36), 是[36,37),  [37,38), java[38,42),  [42,43), 实现[43,45), 的[45,46), 。[46,47), [47,48), [48,49), 这[49,50), 对于[50,52), 非[52,53),  [53,54), java[54,58),  [58,59), 开发者[59,62), 而言[62,64), 很[64,65), 不[65,66), 友好[66,68), ,[68,69), 对于[69,71), 不会[71,73), 编程[73,75), 的[75,76), 用户[76,78), 更加[78,80), 不[80,81), 友好[81,83), 。[83,84), [84,85), [85,86), 为了[86,88), 让[88,89), 更多[89,91), 的[91,92), 人[92,93), 可以[93,95), 使用[95,97), 到[97,98), 这些[98,100), 简单[100,102), 的[102,103), 小工[103,105), 具[105,106), ,[106,107), 周末[107,109), 抽时间[109,112), 将[112,113), 几个[113,115), 开源[115,117), 项目[117,119), 添加[119,121), 了[121,122),  [122,123), web[123,126),  [126,127), 服务[127,129), 实现[129,131), 。[131,132)]

汉字相似度

简介:汉字相似度计算工具。中文形近字算法

在线地址:https://houbb.github.io/opensource/nlp-hanzi-similar/

开源地址:https://github.com/houbb/nlp-hanzi-similar

markdown 目录

简介:为 markdown 文件生成 toc 目录

在线地址:https://houbb.github.io/opensource/markdown-toc/

开源地址:https://github.com/houbb/markdown-toc

个人平时的博客都是使用 markdown 编写的,专注于写作。markdown-toc 可以为这样的文本生成对应的 toc。

比如本篇文章,直接放在 github 上,是支持跳转的。

* [前言](#前言)
* [开源项目](#开源项目)
* [中文繁简体转换](#中文繁简体转换)
* [用法简介](#用法简介)
* [敏感词](#敏感词)
* [拼音](#拼音)
* [分词](#分词)
* [汉字相似度](#汉字相似度)
* [markdown 目录](#markdown-目录)

小结

这样的小工具,实现起来非常简单。

但是对于用户而言,意义还是比较大的。

最近在学习一些 AI 相关的东西,自己平时不搞 python,很多开源项目,没有 web 体验版本看起来就会很吃力。

不同的语言产生了难以逾越的鸿沟,愿你我能够借助 WEB 的力量,跨过去

原文地址

开源项目在线化

最新文章

  1. Webmin 安装 (centos7 rpm 方式)
  2. 程序后端调用post请求。
  3. bootstrap的介绍 和使用
  4. OC中协议, 类目, 时间, 延展, 属性
  5. 在spark中操作mysql数据 ---- spark学习之七
  6. JS如何获取多个相同class标签并分别再输出各自的文本
  7. OC中的单例设计模式及单例的宏抽取
  8. 【HDOJ】1109 Run Away
  9. dp优化
  10. Android 中 GridView 常用属性合集
  11. 【转】java JTable排序和过滤
  12. D5
  13. wpf之数据触发器DataTrigger
  14. 网络编程中TCP基础巩固以及Linux打开的文件过多文件句柄的总结
  15. 嵌入式V3s交叉编译 tslib和QT4.8.7,并使用Qt Creator编译项目
  16. mpi4python
  17. 简单的栈溢出demo
  18. 简易Java文本编译器(C++)
  19. 03: KindEditor (HTML可视化编辑器)
  20. vue-webpack 做出来的项目部署到服务器上,点开是空白页(我这里把项目发布到git上)

热门文章

  1. 【java】学习路径18-Arrays中的sort、binarySearch使用注意
  2. Linux或Docker里安装minio / Docker中安装h5ai
  3. vscode主题开发
  4. 坚守自主创新,璞华HawkEye IETM系统惠及国计民生
  5. Windows 客户端802.1x的一些设置
  6. 有偿提供ES 7.X和8.X 版本 的白金版和企业版 使用咨询服务
  7. 6.Ceph 基础篇 - CephFS 文件系统
  8. 20. 使用Fluentd发送告警邮件
  9. a += 20 和 a = a+20前者不报错,后者报错的原因
  10. 《Thinking In Java》作者:不要使用并发!