Skip to content

服务器托管,北京服务器托管,服务器租用-价格及机房咨询

Menu
  • 首页
  • 关于我们
  • 新闻资讯
  • 数据中心
  • 服务器托管
  • 服务器租用
  • 机房租用
  • 支持中心
  • 解决方案
  • 联系我们
Menu

自然语言处理 Paddle NLP – 信息抽取技术及应用

Posted on 2023年9月19日 by hackdl

1.什么是信息抽取

即自动从无结构或半结构的文本中抽取出结构化信息的任务(病历抽取)

2.实体抽取
3.关系抽取
4.事件抽取

信息抽取和知识图谱是一个上下游的关系。抽取的结果,可以组装成知识图谱(一种存储知识的结构)


医疗、金融、法律,三大行业用得比较多

从问诊中抽取信息

贷款审核,大量的纸质、DPF文件,需要将里面的信息进行匹配审核


根据抽取结果在不在原文中对信息抽取分类
这次我们只关注抽取式,不在原文中的情况需要参考生成方法

  • 抽取式:结果在原文中
  • 生成式:结果不在原文中,如果生成的结果需要一个知识做为辅助,就需要知识图谱,很多时候不需要知识图谱

抽取式分类

  • 实体抽取
  • 关系抽取
  • 事件抽取

信息抽取的通用评测指标,所有的信息抽取都可以用它评
Precision:抽取出来的结果,抽出来10个,5个对的,就是 50%
Recall:关注模型漏了哪些东西,指标0~1,数值越高,模型越好
F1:Precision和Recall的综合平均,是两个的综合反映

抽取模型的关键要素:解码设计

实体抽取

从一段文本中抽取出文本内容,并识别为预定义的类别

一般是 BIO 解码方式 + CRF 模型结构

复杂的实体抽取,无法用 BIO 直接解决(用到关系抽取)
复杂实体抽取中的问题1:重叠嵌套

复杂实体抽取中的问题2:不连续

关系抽取

从文本中抽取出一对实体和预定义的关系类型,得到包含语义信息的实体关系三元组关系是有方向的,抽取的两个实体一般称作头实体(HeadEntity)和尾实体(TailEntity)


关系分类是关系抽取的第二步

解码设计
训练集需要人工标注或其它标注
简单关系抽取

复杂关系抽取,将 CRF 升级成 Sigmoid,判断大于 0.5 是一个类别,小于则不是

实体对组合

效果最好的模型,可以预测很多个类别

SPO 主谓宾

事件抽取

从一段文本中抽取出预定义的事件触发词和事件要素,组合为相应的结构化信息除了事件,实际应用中信息抽取的结果可能更加复杂,但都可以拆成关系抽取


服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
机房租用,北京机房租用,IDC机房托管, http://www.fwqtg.net

Related posts:

  1. 星联服务器托管
  2. 中国万网:高效的服务器托管方案
  3. 石景山数据中心机房设施技术咨询
  4. 重庆低价云服务器托管市场分析
  5. 探寻服务器托管交易市场的所在地

服务器托管,北京服务器托管,服务器租用,机房机柜带宽租用

服务器托管

咨询:董先生

电话13051898268 QQ/微信93663045!

上一篇: 【React工作记录一百零九】前端小知识点扫盲笔记记录10
下一篇: Vue中的脚手架和路由 私人博客 系列文章目录 脚手架和路由这是首页这是列表页这是详情页

最新更新

  • 使用 Databend 加速 Hive 查询
  • C国演义 [第六章] 最长递增子序列 最长连续递增序列
  • 领域驱动设计(DDD):DDD落地问题和一些解决方法
  • JavaScript 及其众多框架
  • 接口使用的最佳时机

随机推荐

  • “高效套利托管服务器解析”
  • 拉萨电脑服务器托管机构电话查询
  • 深入解析服务器托管机位图
  • chart显示数据多个尖尖
  • 天津机房服务器托管服务简介

客服咨询

  • 董先生
  • 微信/QQ:93663045
  • 电话:13051898268
  • 邮箱:dongli@hhisp.com
  • 地址:北京市石景山区重聚园甲18号2层

友情链接

  • 服务器托管
  • 机房租用托管
  • 服务器租用托管
©2023 服务器托管,北京服务器托管,服务器租用-价格及机房咨询 京ICP备13047091号-8