您现在的位置: 首页» 科学研究» 科研团队
科研团队
中文信息处理与机器学习研究团队
更新时间:2015-01-22 点击数:

团队负责人:李济洪 教授、博士、博士生导师

 

★ 负责人李济洪简介

    1964年7月生,现为山西大学软件学院院长,博士,教授,山西大学计算机科学与技术一级学科博士点的博士生指导教师。中国中文信息学会(国家一级学会)理事,山西省数学会常务理事,山西省计算机学会理事。

    山西大学数学系基础数学专业本科毕业,中国科学院系统科学研究所概率论与数理统计专业理学硕士,山西大学计算机应用技术专业工学博士。

    目前主要研究方向有:机器学习、中文信息处理、软件质量评测。 目前,团队在研国家自然科学基金2项、社会科学基金1项,完成国家自然科学基金1项、联合基金1项,完成山西省科技项目20余项,山西省教学成果奖1项。 在Neural Computation, IEEE Transactions on  Knowledge  and  Data Engineering, Information Sciences Pattern Recognition Letter,  软件学报, 计算机研究与发展,中文信息学报,应用数学学报, 应用概率统计 等国内外刊物上发表论文40余篇

 ★ 团队研究方向和内容:

1、研究面向大规模文本数据的重抽样(resampling),或子抽样(subsampling)的方法,以及相关的机器学习的理论和方法。近年来,主要提出多次重复的2折的正则化交叉验证方法(mx2 BCV),研究了在mx2 BCV下的算法性能对照、特征选择、区间估计、序贯检验的理论与方法。

2、研究汉语句法语义分析器:探索汉语词语的分布表征的机理,汉语二分结构句法分析,汉语框架语义角色标注。研发中文信息处理技术开放平台,提供中文文本处理的的软件系统。

3、研究基于软件源代码的软件缺陷预测的理论与方法。

★ 团队成员基本情况:

姓名

性别

职称

学历

毕业学校

毕业时间

所学专业

王钰

副高

研究生

山西大学

2006.7

统计学

王瑞波

工程师

研究生

山西大学

2009.7

计算机

谷波

讲师

研究生

山西大学

2004.7

计算机

石隽锋

讲师

研究生

山西大学

2004.7

计算机

曹学飞

讲师

研究生

西北工业大学

2006.7

计算机

郭新峰

副高

研究生

山西大学

2002.7

计算机

杨杏丽

讲师

研究生

山西大学

2010.7

统计学

牛   倩讲师研究生天津理工大学2012.7软件工程

★ 自然语言处理技术平台: https://nlp.sxu.edu.cn

★ 近年代表性论文(2011--  )

19.Wang Ruibo, Li Jihong Bayes Test of Precision, Recall, and F1 Measure for Comparison of Two Natural Language Processing Models. ACL2019 long paper. 

18. 崔军,刘亚娜,郭新锋,王瑞波,李济洪,基于最大信息系数的静态软件缺陷预测,应用概率统计2019351

17. 谷波,王瑞波,李济洪,李国臣,基于RNN的中文二元结构句法分析,中文信息学报,2019,No.1 PDF

16. 王瑞波,王钰,李济洪,面向文本数据的正则化交叉验证方法,中文信息学报,2019,No.2 DOC

15. Ruibo Wang, Jihong Li, Xingli Yang, Jing Yang, Block-regularized Repeated Learning-Testing for Estimating Generalization Error. Information Science2019, 477. p246–264. SCI, CCF(B)

14. Yu Wang, Jihong Li,Yanfang Li, Choosing Between Two Classification Learning Algorithms Based on Calibrated Balanced 5×2 Cross-Validated F-Test. Neural Processing Letters, 2017, 46(1), pp 1-13 . SCI,CCF(C)  pdf

13. Ruibo Wang, Yu Wang, Jihong Li, Xinli Yang, Jing Yang, Block-regularized mx2 Cross-validated Estimator of Generalization error. Neural Computation 2017, Vol. 29, No. 2: 519–554. SCI,CCF(B) pdf

12. 王瑞波,李济洪,李国臣,杨耀文.  基于Dropout 正则化的汉语框架语义角色识别中文信息学报. 2017,31(1).   pdf

11. Yang Liu, Li Jihong,Wang Yu, Unbiased Condition of the Dispersion Efects Estimator in Unreplicated Two-Level Factorial Experiments. Journal of Systems Science and Complexity.  2016, VOL. 23,No.6   SCI 

10. 李国臣, 刘展鹏, 王瑞波, 李济洪. 融合分词隐层特征的汉语基本块识别. 中文信息学报. 201630(2).

9. Yu Wang, Jihong Li, Credible Intervals for Precision and Recall Based on a K-fold Cross-validated Beta Distribution.  Neural Computation,   2016, Vol. 28, No. 8 , Pages 1694-1722.
  SCI,CCF(B) pdf

8. Yu Wang, Jihong Li, Ruibo Wang,Xingli Yang, Confidence Interval for F1 Measure of Algorithm Performance Based on Blocked 3×2 Cross-validation,IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2015,27(3):651-659. SCI,CCF(A) pdf

7、Yu Wang,Jihong Li(*), Yanfang Li,  Measure for data partitioning in m×2 cross-validation. Pattern Recognition Letters. 2015,65:211-217.SCI,CCF(C) pdf

6. Wang Yu, Wang Ruibo,Jia Huichen, Li Jihong, Blocked 3×2 cross-validated t-test for comparing supervised classification learning algorithms,Neural Computation, Vol.26 No.1 2014,2014-01-01 00:00:00, SCI,CCF(B) pdf

5. 杨杏丽 王钰 王瑞波 李济洪 基于组块3×2交叉验证的预测误差估计的方差,应用概率统计, 2014, 30(4):372-380

4. 宋毅君 李济洪 基于条件随机场模型的汉语框架语义角色自动标注,中文信息学报,2014 VOL.28(3) p36-47 pdf

3. 李济洪 胡军艳 王钰  预测误差的组块3x2交叉验证估计--基于生物数据的模拟比较研究.  生物数学学报  2014, 29(4):700-710.

2. 王钰 李济洪 冯霞 无重复因析试验中散度效应的ML估计,系统科学与数学. 2011, Vol31(7),804-816.

1. 李济洪 高亚慧 王瑞波 李国臣汉语框架自动识别中的歧义消解,中文信息学报. 2011, Vol.25 No.3 p38-44.

★ 2005--2010年 论文

1. Li Jihong, Wang Ruibo,Gao yahui  Sequential Tagging of Semantic Roles on Chinese FrameNet,The 8th Workshop on Asian Language Resources,COLING 2010,2010,2010-08-21 00:00:00,国际会议论文集 

2. 李济洪 王钰 张星 两水平无重复因析试验散度效应的估计,应用数学学报,Vol.33 (4):710-721,2010-07-01 00:00:00,一级学科主学报 

3. 王钰 李济洪 无重复因析试验中一种散度效应的估计方法,山西大学学报,33(2):186-189,2010-05-15 00:00:00,统计源期刊 

4. 李济洪 任改仙 王钰 两水平无重复因析试验散度效应BH估计的性质,应用概率统计,VOL.26(2) 179-189,2010-04-01 00:00:00,二级学科主学报 

5. 李济洪 王瑞波 王蔚林 李国臣汉语框架语义角色自动标注,软件学报,Vol.21(4):597-611,2010-01-01 00:00:00,一级学科主学报  pdf

6. 李国臣 王瑞波 李济洪 基于条件随机场模型的汉语功能块自动标注,计算机研究与发展,VOL.47(2):336-443,2010-01-01 00:00:00,一级学科主学报 

7. 李济洪 王瑞波 王蔚林 谷波 李国臣 Automatic Labeling of Semantic Role on Chinese FrameNet Using Conditional Random Fields,Procedings of WI / IAT 2009,2009,2009-09-15 00:00:00,国际会议论文集 

8. 王钰 李济洪 无重复因析试验中散度效应的截断估计及其性质,山西大学学报,32 (3) : 353-357,2009-08-15 00:00:00,统计源期刊 

9. 李济洪 杨杏丽 王瑞波 张娜 李国臣基于规则的中文阅读理解问题回答技术研究,中文信息学报,23(4): 3-9,2009-07-01 00:00:00,二级学科主学报 

10. 李济洪 杨柳 王钰 截尾线性回归模型参数极大似然估计的存在性和唯一性,应用数学学报,Vol. 32 No. 2 p225-233,2009-03-01 00:00:00,一级学科主学报 

11. 宋毅君 李补喜 李济洪 带有不完全信息随机截尾试验下最大似然估计的重对数律,应用概率统计,2009 25 (2): 113-125,2009-02-20 00:00:00,二级学科主学报 

12. 李济洪 王瑞波 王凯华 李国臣基于最大熵模型的中文阅读理解问题回答技术研究,中文信息学报,Vol.22 No.6 P.55-62,2008-12-01 00:00:00,二级学科主学报 

12. 李济洪 毕华 带有截尾数据的无重复因子试验的位置效应和散度效应分析,山西大学学报,31(3):364-371,2008-06-01 00:00:00,统计源期刊 

13. 郝晓燕 李济洪 由丽萍 刘开瑛中文阅读理解语料库构建技术研究,中文信息学报,21(6):29-35,2007-12-01 00:00:00,二级学科主学报 

14. 谷波 李济洪 刘开瑛 基于COSA算法的中文文本聚类,中文信息学报,21(6):65-70,2007-11-01 00:00:00,二级学科主学报 

15. 张娜 李济洪 基于语义标注的中文阅读理解语料库的建设,第九届全国计算语言学学术会议论文集,清华大学出版社,2007,P338-343,2007-08-01 00:00:00,其他正式刊物 

16. 王凯华 李济洪 张国华 王瑞波基于最大熵模型的中文阅读理解问答系统技术研究,第九届全国计算语言学学术会议论文集,清华大学出版社,2007,P643-648,2007-08-01 00:00:00,其他正式刊物 

17. 李济洪 王钰 杨柳 The Existence of Maximum Likelihood Estimates in Location and Dispersion Regression Models with Censored Data,DCDIS Series B, Preceeding of Complex Systems and Applications Modeling, Control and Sinmulation,2007,Vol.14(S2),402-405,2007-06-01 00:00:00,国际会议论文集 

18. 王钰 李济洪 杨柳 The Existence of Maximum Likelihood Estimates in Heteroscedastic Linear Models with Censored Data,DCDIS Series B, Preceeding of Complex Systems and Applications Modeling, Control and Sinmulation,2007,Vol.14(S2) , 416-420,2007-06-01 00:00:00,国际会议论文集.

◆  项目:(2015-)

5、王瑞波 李济洪  曹学飞  杨杏丽,面向文本数据的正则化交叉验证方法研究 国家自然科学青年基金项目,24万, 2019-01 

4、李济洪 王钰  王瑞波 曹学飞 杨杏丽,  国家自然科学基金委员会-广东省政府联合基金(第二期)超级计算科学应用研究专项第二期资助,12万,2016-8

3、李济洪 王钰 崔军 王瑞波 宋毅君 曹学飞 杨杏丽, 文本数据挖掘分类算法性能对照的序贯检验方法研究. 国家社科基金项目,20万,2016-07

2、李济洪 王钰  王瑞波 宋毅君 曹学飞 杨杏丽, 面向文本数据模型性能比较的交叉验证t-检验, 山西省自然科学基金项目,3万,2016-06

1、王钰 李济洪 王瑞波 杨杏丽 曹学飞 牛奉高, 方差正则化的分类模型选择方法研究. 国家自然科学青年基金项目,18万,2015-09

◆  项目:(2015 以前的)

1、李济洪 宋毅君 崔军 李国臣 王瑞波 王炜 张青刚 王钰 杨杏丽 张强 中文信息处理技术开放平台,山西省科技基础条件平台建设项目,资助额:30.00万元,2013-06

2、李济洪 宋毅君 张青刚 王炜 王瑞波 王钰 杨杏丽 张强 家会臣 山西省网络科技环境高性能计算平台建设(三期)——应用计算软件,山西省科技基础条件平台建设项目,资助额:20.00万元,2011-05

3、李济洪 李国臣 宋毅君 谷波 刘开瑛 王瑞波 王蔚林 张国华 王钰 杨杏丽 汉语框架语义角色自动标注技术研究,国家自然科学基金,资助额:35.00万元,2009-01

4、李济洪 张青刚 宋毅君 IPV4与IPV6双栈网络技术开发与应用,山西省高校高新技术产业化项目,资助额:5.00万元,2009-07

5、李济洪 李国臣 宋毅君 张青刚 王瑞波 王钰 张强 王蔚林 杨杏丽 山西省网络科技环境高性能计算平台建设(二期),山西省科技基础条件平台建设项目,资助额:40.00万元,2009-03

6、李国臣 李济洪 宋毅君 谷波 由丽萍 王凯华 张国华 尹晓丽 张娜 基于框架语义网络的中文文本自动分类计算机处理,山西省科技攻关计划,资助额:10.00万元,2007-04

7、李济洪 宋毅君 张青刚 王炜 王鈺 张强 任治国 王凯华 张国华 山西省网络科技环境高性能计算平台建设,山西省科技基础条件平台建设项目,资助额:25.00万元,2008-05

8、李济洪 宋毅君 张强 张青刚 张红艳 王凯华 张国华 王瑞波 山西省科技基础条件平台信息整合门户系统(二期),山西省科技基础条件平台建设项目,资助额:10.00万元,2007-04

9、李济洪 宋毅君 张强 任治国 张青刚 山西省科技基础条件网络平台建设-信息整合门户系统,山西省科技基础条件平台建设项目,资助额:10.00万元,2006-04

10、宋毅君 张青刚 王瑞波 李济洪智能数据采集与分析系统研发项目,横向科研项目,资助额:17.90万元,2011-12

 

 

 

 


相关附件:

基于rnn的中文二分结构句法分析.pdf

面向文本数据的正则化交叉验证方法.doc

1-s2.0-s0167865515002573-main.pdf

[2016 中文信息学报] 基于dropout正则化的汉语框架语义角色识别.pdf

[2017 neco] block-regularized m×2 cross-validated e....pdf

[2016 nepl] choosing between two classification learning.pdf

[2016 neco] credible intervals for precision and recall based.pdf

基于条件随机场的汉语框架语义角色自动标注.pdf

汉语框架自动识别中的歧义消解.pdf

汉语框架语义角色的自动标注.pdf

tkde.pdf

neco.pdf