一、数据来源
原始数据资料
本网站《论语》相关数据的原始来源为台湾省中央研究院 - 上古汉语标记语料库。该语料库是古籍研究领域具有广泛认可度的标注型语料库,自1990年由黄居仁(中央研究院语言所研究员)、谭朴森(英国伦敦大学亚非学院教授)、陈克健(中央研究院资讯所研究员)、魏培泉(中央研究院语言所研究员)等学者共同发起建构以来,建设工作从未间断。随着研究需求的拓展,其语料覆盖范围已从初始的上古汉语,逐步扩充至中古汉语与近代汉语,为古籍文本的数字化研究提供了扎实、可靠的基础支撑。
《论语》数据资源
基于上述权威原始语料,本网站以《论语》为核心展示对象,首先对带标注的《论语》全文开展剔除冗余标注、修正格式误差、统一文本编码等一系列数据清洗与规范化处理,以确保基础文本的准确性;在此前提下,再通过语义重要性评估与研究价值筛选,最终确定142个《论语》中高频出现、且具备人文研究意义的概念字词作为核心内容。
目前网站呈现的核心数据包含:概念词对应的《论语》原句及所属篇章、概念提出者信息、概念词语境释义、高频共现概念、语义相似概念、逻辑对立概念等,总计形成超4000条结构化数据条目。其中,概念词的基础释义主要参考中文古诗文领域权威平台"古诗文网"提供的《论语》原文释义,以保障释义的经典性与准确性;概念词语境释义与概念间关系(共现、相似、对立)推理,则综合考察并选用了deepseek-r1、deepseek-v3、qwen-turbo-latest、qwen-max-latest、qwen-long-latest等主流中文通用大模型进行批量推理与效果对比,以此提升数据处理的效率与覆盖范围。
为最大程度减少大模型生成内容可能存在的偏差,网站团队邀请了来自中国人民大学、上海交通大学等知名高校的多名人文社科领域研究员,对模型生成的语境释义及概念关系数据开展多轮人工校对与交叉评价,最大程度保障最终呈现数据的真实性、可靠性与学术严谨性。
二、网站功能
本平台是一个集知识可视化、学术研究、文化传播于一体的数字人文平台,专注于对《论语》中的核心哲学概念进行系统化、结构化的展示与解析。
概念释义系统
提供《论语》中142个核心概念的详细解读,包括中文名称、拼音、类型、详细释义、出处、相似概念、对立概念、共现概念及相关学术文献。
知识图谱可视化
通过交互式知识图谱展示概念间的语义关系,支持环形图和力导向图两种布局,提供智能图例控制和概念快速导航功能。
智能问答系统
基于知识图谱增强的智能问答,支持多种大模型,能够理解用户意图并提供精准的《论语》相关知识解答。