重建人类语言的数字谱系

Ancient Language Big Data Platform

iLogos平台是首个专注于古代语言大数据的科研基础设施,集成iLatin拉丁语语料库、iGreek希腊语语料库及智能词典iLex,为历史语言学、数字人文研究提供全新工具。

平台构成

三大核心组件,构建古代语言研究新范式

iLatin Corpus

全面收录从古典时期到中世纪的拉丁语文本,包含碑铭、手稿、文学著作等多源数据。支持高级语法检索、历时分析、变体对比。

覆盖时期:公元前3世纪 - 公元15世纪

数据规模:目标词条 15M+

开发进行中

iGreek Corpus

涵盖古希腊语各个时期与方言的文本集合,从迈锡尼线性B到拜占庭文献,实现跨时代语言演变追踪与方言对比分析。

覆盖方言:爱奥尼亚、多利亚、阿提卡等

数据规模:规划词条 10M+

规划阶段

iLex Dictionary

智能拉丁语词典,深度整合语料库实例,提供词源学信息、使用频率统计、历时语义演化和共现网络可视化。

核心功能:智能查询、词族分析、搭配统计

词条目标:50,000+ 基础词条

同步开发中

技术特性

融合现代自然语言处理技术与古典语言学方法

NLP增强分析

定制古语言处理模型,支持词形还原、句法分析、语义标注

历时可视化

词汇使用频率、语义演变、语法变化的跨世纪追踪

高级检索

支持正则表达式、模糊查询、语法特征检索等专业功能

开放API

RESTful API接口,支持学术研究和第三方工具集成