1系统概述
根Delphi Group 2001报告中指出企业中百分八十知识非结构化信息形式存中百分八十表现文文件知识理必须文件着手文件分类必步骤文件分类手工进行问题:成高速度慢信息更新频率慢客观性足分类效果致性低调整性低
深思公司述问题提出行解决方案深思智分类系统
深思智分类系统采IBM中国研究中心独家授权新中文信息处理研究成果集成强IBM中文分词软件置先进SVMKNN分类引擎应新统计学知识语言学知识准确率召回率等项技术指标位居业界前列动分类准确率达85够满足数应实需求
2特点
21强核心技术
中文语义理解 采先进中文然语言理解中文分词技术中文语义容实现动分类
高级分类算法 采IBM世界领先SVM分类算法KNN分类算法实现分类引擎具极高分类准确率分类速度
海量处理力 采线程技术实现行处理理千万量级海量文件集合单日分类力达十万篇
国语言支持 目前支持简体中文繁体中文英文
22完整信息整合
支持种数格式 支持常格式文件入库检索TEXT HTML RTF MS WORDPDF等
支持种异质数源 采选信息整合工具整合部分企业信息数源包括关系型数库文件系统网站Notes文档库等
23高效动分类
方便图形理界面 理者利清楚易操作流畅图形界面轻松理维护分类目录
专业分类目录构建 轻松建立理分类目录目录进行新增删修改移动等操作
完整分类训练流程 通训练样预先测试调整线运行确保分类精确性时设定训练样调整样测试样等层次训练材料
精确分类效果评估 提供开放封闭等测试方法完整记录测试结果客观评估分类精确程度
24柔性分类方式
单文件重分类 采重分类法份文件分类分类法目录
虚拟目录重属 某目录属层目录通设定快捷方式单目录虚拟连接合适目录
特殊规定义 处理单纯采中文语义概念分类外分类器更提供规设定特殊需求定义规规做资料滤条件
25方便系统理
整合单界面 系统提供基Web户界面理员界面满足系统理员户双重需求利浏览器远程理分类目录户权限调整加强分类结果
完整目录维护 提供完整分类目录进行新增移动修改删等理维护
权限理设定理目录单文件权限加强安全理
实时文件理 浏览目录分类结果实时进行移动更名等调整指定训练样强化分类质量
强搜索服务 结合选中文全文检索引擎户配合关键字条件检索资料
友线帮助 提供友指南
26灵活开发接口
提供C API Javabeans组件
27系统开放性
支持 DB2 Oracle等流RDBMS缝集成领先方案
支持种WindowsAIXSolarisLinux等流操作系统支持种Web应服务器Web服务器
3应环境
31硬件环境
求硬件运行AIXSolarisLinuxWindows NTWindows 2000操作系统存建议512M
32软件系统
支持AIXLinuxSolaris三种UNIX操作系统Windows NTWindows 2000操作系统
软件运行外需关系型数库(DB2OracleSQL Server等)Java应服务器(WebsphereWeblogic等)支持
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档