工作中时常遇到字符串转换为拼音的需求。特别目前在各大网站平台都可以看到的基于拼音的查询功能。如果在查询中增加相应的拼音查询,就可以减少很多的因中文汉字完全输入的不便利,例如:当我要查询叫”郭德纲“人员时,直接输入"GDG"即可,这样是不是比较方便输入。
    
    中文汉字有个特点:同字不同音 。在不同的语境或中文汉字组合时,会出现不同的读法。比如:参加会议中的”参“和中药材人参中“参”是两个不同的读音,诸如这样的中文汉字有不少的。本版块的实现也存在这样的问题。可以通过项目或平台基于使用中文多音字的频率来选择同一的转换,比如说:你所在的公司是中药材有关的行业,就可以将“参”对应的字母匹配为“S";如果你所在的公司具有起人名的业务,可以将中文汉字”查“(姓氏读查,如查良庸----起笔名为金庸)的字母匹配为”C“等等。
 
 IF OBJECT_ID(N'dbo.ufn_Pinyin', N'FN') IS NOT NULL
BEGIN
DROP FUNCTION dbo.ufn_Pinyin;
END
GO --==================================
-- 功能: 获取字符串的拼音
-- 说明: 针对中文汉字的多音字情况,可以在函数中增加多音字的字母匹配,缺点就是以后遇到该中文汉字不论其作出语境如何都会按照其多音字的字母匹配。
-- 作者: XXX
-- 创建: XXXX-XX-XX
-- 修改: XXX-XXX-XX XXX XXXXXXXX
-- 调用: SELECT dbo.ufn_Pinyin(N'中国') AS Pinyin;
--==================================
CREATE FUNCTION dbo.ufn_Pinyin
(
@chvnStr NVARCHAR() -- 字符串
) RETURNS NVARCHAR()
--$Encode$--
AS
BEGIN
-- NULL默认值处理
SET @chvnStr = ISNULL(@chvnStr, N''); -- 声明局部变量
DECLARE
@intLen AS INT,
@chvnPinyin AS NVARCHAR(),
@chnCharacter AS NCHAR();
-- 初始化局部变量
SELECT
@intLen = ,
@chvnPinyin = N'',
@chnCharacter = N''; -- 插入的字符串为空字符串则直接返回该函数
IF @chvnStr = N''
BEGIN
RETURN @chvnPinyin;
END -- 声明中文汉字的局部表变量
DECLARE @tblChineseCharacter TABLE (
ChineseCharacter NCHAR() COLLATE Chinese_PRC_CI_AS NOT NULL,
Letter NCHAR() NOT NULL
); -- 向中文汉字的局部表变量插入数据
INSERT INTO @tblChineseCharacter (ChineseCharacter, Letter)
SELECT N'吖', N'A' UNION ALL SELECT N'八', 'B' UNION ALL SELECT N'嚓', 'C' UNION ALL SELECT N'咑', N'D' UNION ALL
SELECT N'妸', N'E' UNION ALL SELECT N'发', 'F' UNION ALL SELECT N'旮', 'G' UNION ALL SELECT N'铪', N'H' UNION ALL
SELECT N'丌', N'J' UNION ALL SELECT N'咔', 'K' UNION ALL SELECT N'垃', 'L' UNION ALL SELECT N'嘸', N'M' UNION ALL
SELECT N'拏', N'N' UNION ALL SELECT N'噢', 'O' UNION ALL SELECT N'妑', 'P' UNION ALL SELECT N'七', N'Q' UNION ALL
SELECT N'呥', N'R' UNION ALL SELECT N'仨', 'S' UNION ALL SELECT N'他', 'T' UNION ALL SELECT N'屲', N'W' UNION ALL
SELECT N'夕', N'X' UNION ALL SELECT N'丫', 'Y' UNION ALL SELECT N'帀', 'Z' UNION ALL SELECT N'参', N'S' /*增加多音字的字母匹配*/; -- 获取字符串的长度
SET @intLen= LEN(@chvnStr); WHILE @intLen >= /*@intLen > 0*/
BEGIN
-- 从后往前逐次获取单个字符
SET @chnCharacter = SUBSTRING(@chvnStr, @intLen, ); -- 获取当前字符对应的字母
SELECT TOP @chvnPinyin = Letter + @chvnPinyin
FROM @tblChineseCharacter
WHERE ChineseCharacter <= @chnCharacter
ORDER BY ChineseCharacter DESC; -- 如果当前受影响的行数为0,则表示当前字符可能是中文外的其他字符,如英文字符等等
IF @@ROWCOUNT =
BEGIN
SET @chvnPinyin = SUBSTRING(@chvnStr, @intLen, ) + @chvnPinyin;
END -- 字符串长度局部变量递减
SET @intLen = @intLen - ;
END RETURN @chvnPinyin;
END
GO

演示该函数的效果,如下的T-SQL:

 SELECT dbo.ufn_Pinyin(N'中国') AS ColName,dbo.ufn_Pinyin(N'中国ilove你') AS Col2Name, dbo.ufn_Pinyin(N'中国我爱你') AS Col3Name;
GO

执行的后的查询结果如下:

 
博友有解决中文多音字的拼音字母匹配的好方案,也请不吝赐教,万分感谢。
 
注意:该以上实现如果存在侵权,也请原作者提出来,谢谢。

最新文章

  1. ueditor的模板功能
  2. PBOC~PPT-补充A(转)
  3. C# windows form如何隐藏窗口?
  4. 如何通过java代码对kylin进行cube build
  5. 【BZOJ】【4027】【HEOI2015】兔子与樱花
  6. ExtJs5_继承自定义一个控件
  7. 借助VBScript让Windows系统发出声音
  8. 关于makefile中变量的多次赋值以及override指令
  9. angularf封装echarts
  10. Ubuntu 配置FTP服务器
  11. Android OpenGL ES 开发(四): OpenGL ES 绘制形状
  12. es6下 vue实例属性template不能使用
  13. Oracle sql function LISTAGG
  14. oracle数据库导出与导入
  15. 1. Go安装
  16. PyQt5安装及ModuleNotFoundError: No module named &#39;PyQt5&#39;问题解决
  17. linux中命令突然不能用
  18. Graphviz 环境变量设置
  19. 《关于oracle数据库的勒索病毒的预警》
  20. 【Codeforces】【#295】【Div.2】

热门文章

  1. SoapUI 使用笔记
  2. 理解Ruby中的作用域
  3. 系统配置文件的加载设置-以xml文件为例
  4. 七个结构模式之组合模式(Composite Pattern)
  5. 在Java中如何实现“Pless presss any key to continue.”
  6. 05Mybatis_入门程序——根据id查询用户
  7. 【MVC学习笔记01】初窥奥秘
  8. javascript笔记图
  9. Eclipse Plug-in Hello world
  10. 从客户端(?)中检测到有潜在危险的 Request.Path 值 的解决方案