我们是来是华东师范大学的 CubeNLP 团队,致力于研究自然语言处理和机器学习/深度学习相关的理论。目前的主要研究方向为:信息抽取,自然语言阅读理解,对话生成,知识图谱,实体对齐等。
2024/12
贯彻落实学校数智跃升计划,积极探索AI赋能人文社科研究范式转型,激发创新发展新动能。聚焦智能教育等重点研究领域,推进智能教育教育部文科实验室(培育),为AI赋能人文社科研究提供坚实平台支撑。赵尚卿、任育培、王志宏等同学所属的智能教育研究团队持续攻坚,“小花狮作文智能辅导系统”不断升级迭代。着力发展有温度的智能教育,以数智化引领教育强国建设。
2024/12
由计算机学院兰曼教授指导、计算机学院研究生宋文正(24级硕士)和刘曙(24级博士)与亚欧商学院叶琪、经济与管理学院韦豪共同组成的金融科技团队,凭借新一代多智能体智能投研平台--“翌金”系统,在第三届中国研究生金融科技创新大赛中荣获全国一等奖,并在总决赛中跻身四强,最终夺得铜奖,兰曼教授获得全国优秀指导教师殊荣。
面对未被满足的需求,产学研协同创新填补市场空白、引领产业发展,已成为一种有效机制。针对中国手机企业出海过程中遇到的小语种难题,上海传英公司联合华东师范大学开发了适用于当地小语种的知识问答与对话系统。在此基础上开发的首款非洲定制智能手机实现销售收入逾17亿元,并入选“2023年度最受非洲消费者喜爱品牌”,被称为“非洲手机之王”,已进入非洲、南亚、中东、拉美等70多个国家和地区。
2024/11
任育培投稿论文《CEAMC: Corpus and Empirical Study of Argument Analysis in Education via LLMs. 》被 EMNLP 2024 接收,提出了 CEAMC 语料库,并展示其在复杂论证场景中的应用,推动了教育领域的论证分析。
2024/11
沈新舒投稿论文《Towards Explainable Chinese Native Learner Essay Fluency Assessment: Dataset, Tasks, and Method》被 EMNLP 2024 接收,提出了 CEFA 语料库,改进了对中文作文流畅性的评估,强调了细粒度标注和错误类型与纠正方法之间的互惠关系。
2024/8
陈洋投稿论文《Are U a Joke Master? Pun Generation via Multi-Stage Curriculum Learning towards a Humor LLM》被 ACL 2024 接收,通过改进偏好学习方法,使大型语言模型能够更好地生成双关语,显著超越现有基线模型。
2024/8
庄薪霖投稿论文《TOREE: Evaluating Topic Relevance of Student Essays for Chinese Primary and Middle School Education》被 ACL 2024 接收,提出了 TOREE 数据集和两步方法,提高了中文作文的主题相关性评估性能。
2024/6
宋宇翔投稿论文《A Lightweight and Effective Multi-View Knowledge Distillation Framework for Text-Image Retrieval.》被 IJCNN 2024 接收,提出了 LEMKD 方法,通过多视图知识蒸馏,提升了文本图像检索中的双流编码器性能,超越了单流模型。
2024/4
华东师范大学自然语言理解CubeNLP实验室联合中国语言文学系构建了一个高中议论文语义解析数据集,并依托NLPCC 2024向公众提供高质量的数据资源和评测平台。此次评测将有力推动研究者和教师对高中议论文进行深入且精细的语义解析,助力学生在论辩能力与写作素养方面上的提升,为中文教育事业的创新发展注入新活力。
今年我们借助NLPCC 2024的平台,组织了NLPCC 2024-第二届中小学作文语篇逻辑评测与融合任务。与去年相比,今年的评测任务不仅扩展到了影响语篇连贯性的多个单一维度的综合研究,而且还探索了这些因素之间的关系。具体而言,我们新增了作文逻辑错误检测、主题连贯性建模和语篇连贯性评语生成等环节,旨在提供一个高质量的语篇连贯性评估数据资源和评测平台,共同推动中文作文语篇逻辑连贯性研究领域进行更深入的探索和发展。
2024/3
今年我们继续依托CCL 2024,组织了CCL 2024-第二届中小学作文流畅性评价评测任务。与去年相比,为进一步全面地对作文的流畅程度进行评估,本次评测任务新增作文流畅性评级任务,并在训练集中新增1200条句子,以方便参赛队伍进行更深入的研究,共同推进中文母语作文流畅性智能批改的发展。
2024/3
今年,我们依托CCL 2024,组织了CCL 2024 中小学作文修辞识别与理解评测任务,包括“中小学作文修辞形式类型识别”、“中小学作文修辞内容类型识别”和“中小学作文修辞成分抽取”三个赛道,为中小学作文修辞理解提供更多依据。
2024/3
陈心豪投稿论文《From Coarse to Fine: A Distillation Method for Fine-Grained Emotion-Causal Span Pair Extraction in Conversation》被 AAAI 2024 接收,提出了一种使用教师模型学习预测话语之间的因果连接词,然后指导学生模型识别细粒度的情感标签和因果范围,而蒸馏方法在RECCON和FG-RECCON数据集上实现了最先进的性能。