首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【NLP】自然语言处理中词性、短语、短语关系标签的具体含义列表

    ROOT:要处理文本的语句 IP:简单从句 NP:名词短语 VP:动词短语 PU:断句符,通常是句号、问号、感叹号等标点符号 LCP:方位词短语 PP:介词短语 CP:由‘的’构成的表示修饰性关系的短语 DNP:由‘的’构成的表示所属关系的短语 ADVP:副词短语 ADJP:形容词短语 DP:限定词短语 QP:量词短语 NN:常用名词 NR:固有名词 NT:时间名词 PN:代词 VV:动词 VC:是 CC:表示连词 VE:有 VA:表语形容词 AS:内容标记(如:了) VRD:动补复合词 CD: 表示基数词 DT: determiner 表示限定词 EX: existential there 存在句 FW: foreign word 外来词 IN: preposition or conjunction, subordinating 介词或从属连词 JJ: adjective or numeral, ordinal 形容词或序数词 JJR: adjective, comparative 形容词比较级 JJS: adjective, superlative 形容词最高级 LS: list item marker 列表标识 MD: modal auxiliary 情态助动词 PDT: pre-determiner 前位限定词 POS: genitive marker 所有格标记 PRP: pronoun, personal 人称代词 RB: adverb 副词 RBR: adverb, comparative 副词比较级 RBS: adverb, superlative 副词最高级 RP: particle 小品词 SYM: symbol 符号 TO:”to” as preposition or infinitive marker 作为介词或不定式标记 WDT: WH-determiner WH限定词 WP: WH-pronoun WH代词 WP$: WH-pronoun, possessive WH所有格代词 WRB:Wh-adverb WH副词

    01

    JDK 15 要来了,新特性尝鲜。

    Java Development Kit 15是甲骨文公司发布 Java SE(标准版)的最新版本,它在6月11日进入缓降阶段,系列功能现在被冻结。JDK 15的亮点包括文本块、隐藏类、外部内存访问API以及密封类和记录的预览。 Java升级的下一个阶段是另一个缓降阶段,从现在起到8月20日有两个可选版本。预计9月15日正式上市。JDK15紧随3月17日发布的JDK14。甲骨文公司遵循标准Java六个月的发布计划,新版本每年发布两次。 第二个孵化器外部内存访问API,它可以使Java程序安全、高效地访问Java堆栈之外的外部内存。API应该能够对各种类型的外部内存进行操作,例如本机内存、持久内存和托管堆。许多Java程序访问外存,如Ignite和MapDB。API将有助于避免垃圾收集相关的成本和不可预测性,跨进程共享内存,并通过将文件映射到内存来序列化和反序列化内存内容。javaAPI目前还没有为访问外存提供令人满意的解决方案。但有了新的提议,即API不应该破坏JVM的安全性。这个功能在jdk14中经历了早期的孵化阶段,在jdk15中进行了改进。 密封类的预览。与接口一起,密封类限制了那些可以扩展或执行的其它类或接口。此特性的目标包括允许类或接口的作者控制由哪些代码负责实现它,并提供比访问修饰符更具声明性的方式来限制超类的使用,还有通过支持对模式的详尽分析来支持模式匹配的未来方向。 删除对Solaris/SPARC、Solaris/x64和Linux/SPARC端口的源代码和构建支持,而在JDK 14中不赞成删除这些端口,但可在将来的版本中删除它们。许多正在开发的项目和功能(如Valhalla、Loom和Panama)需要进行重大更改以适应CPU架构和操作系统特定代码。放弃对Solaris和SPARC端口的支持将使OpenJDK社区的贡献者加快开发新特性,从而推动平台向前发展。近年来,Solaris和SPARC都被Linux操作系统和Intel处理器所取代。 记录作为不可变数据的透明载体的类,在jdk14中作为早期预览发布之后,将被包含在jdk15的第二个预览版本中。该计划的目标包括设计一个面向对象构造来表达一个简单的值聚合。以协助程序员专注于不可变数据的建模,而非扩展性行为。自动实现数据驱动的方法,如equals和assessors,并保留Java中长期存在的原则,如名义类型和迁移兼容性。记录可以看作是名义元组。 基于爱德华曲线数字签名算法(EdDSA)的密码签名。EdDSA是一种现代的椭圆曲线方案,对比JDK中现有的签名方案更具有优势。EdDSA将仅在SunEC提供程序中执行。与其他签名方案相比,EdDSA具有更高的安全性和性能,因此受到人们的青睐;加密库中已经支持EdDSA,如OpenSSL和BoringSSL。 通过替换java.net.datagram.Socket和java.net.MulticastSocket APIs的实现以更简单和更现代的方式重新实现以前的DatagramSocket API。且易于调试和维护使用项目中当前正在探索的虚拟线程。新计划是JDK增强建议353的后续,该提议重新实现了遗留的Socket API。当前java.net.datagram.Socket和java.net.MulticastSocket的实现可以回溯到jdk1.0,那时IPv6还在开发中。因此,当前的MulticastSocket执行试图以难以维护的方式调节IPv4和IPv6。 默认情况下禁用偏向锁定并弃用所有相关的命令行选项。其目标是确定是否需要继续支持高代价维护,及偏向锁的遗留同步优化,该优化用于热点虚拟机,以减少竞争性锁定的开销。尽管某些Java应用程序可能会在禁用偏向锁定的情况下出现性能的回归,但是偏向锁的性能增益通常不如以前那么明显。instanceof匹配第二个预览模式,紧随JDK 14中之前的预览。模式匹配允许程序中的通用逻辑,主要是从对象中有条件地提取组件,以更简洁地表达。Haskell和C等语言因其简洁和安全而采用了模式匹配。 隐藏类,即不能被其他类字节码直接使用的类,倾向于借助框架使用,框架会在运行时生成类并通过反射间接使用它们。隐藏类可被定义为访问控制嵌套的成员,并且可以独立于其他类进行卸载。这项提议将提高JVM上所有语言的效率,方法是使用标准API定义不可发现且生命周期有限的隐藏类。

    02
    领券