- ISO/TS 13725:2021 液压传动 液压缸压曲临界负荷的测定方法
- ISO 8913:2006 航空航天 等级为400°F/3000psi(204℃/20684kPa)和204℃/21000 kPa(400°F/3046psi)的轻型聚四氟乙烯(PTFE)软管组件 采购规范
- ISO 22379:2022 安全和复原力 主办和组织全市或地区活动的指南
- ISO 17854:2013 空间数据和信息传输系统 高速遥测应用的灵活高级编码和调制方案
- ISO 14855-2:2018 塑料材料在受控堆肥条件下最终需氧生物降解能力的测定 析出二氧化碳的分析方法 第2部分:在实验室级试验中二氧化碳析出的重量分析测量
- ISO 5631-1:2009 纸和纸板 漫反射法测定颜色 第1部分:室内日光条件下(C/2°)
- ISO 3692:1976 信息处理.信息交换用的25.4mm(1in)穿孔纸带卷盘和盘芯.尺寸
- ISO 8253-2:2009 声学 测听方法 第2部分:用纯音及窄带测试信号的声场测听
- ISO 2227:1972 工业用甲醛溶液.甲醛含量的测定
- ISO 23606:2009 纺织品 针织织物 表示法和图案设计
ISO 24614-2:2011 语言资源管理 书面文本的单词分割 第2部分:汉语、日语和朝鲜语的单词分割
标准编号:ISO 24614-2:2011
中文名称:语言资源管理 书面文本的单词分割 第2部分:汉语、日语和朝鲜语的单词分割
英文名称:Language resource management — Word segmentation of written texts — Part 2: Word segmentation for Chinese, Japanese and Korean
发布日期:2011-09
标准范围
ISO 24614-1中定义的分词的基本概念和一般原则适用于汉语、日语和韩语。文本需要被分割成标记、单词、短语或一些其他类型的较小文本单元,以便在语言资源上执行某些计算应用,例如自然语言处理、信息检索和机器翻译。ISO 24614-2:2011仅限于将文本分割为单词或其他分词单元(WSU)。这项任务与词法或句法分析本身不同,尽管它在很大程度上依赖于词法句法分析。它也不同于构建一个词汇框架并识别其词条的任务,即引理和词素。后一项任务的框架由ISO 24611、ISO 24613和ISO 24615提供。ISO 24614-2:2011规定了为中文、日文和韩文划定WSU的规则。三种语言都有一些共同的规则,尽管每种语言都有自己独特的识别WSU的规则。讨论了它们的共同特点,然后为中国人、日本人和韩国人制定了不同的规则。
标准预览图

下载信息
下载该资料,将扣除 50 个积分
