首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用心理计算Cohen's kappa时的警告

心理计算Cohen's kappa是一种用于评估分类一致性的统计指标,它衡量了两个评估者之间的一致性程度。它通常用于评估医学诊断、机器学习模型性能等领域。

Cohen's kappa的分类可以分为以下几个级别:

  • 小于0:表示评估者之间的一致性程度低于随机水平。
  • 0.01-0.20:表示评估者之间的一致性程度轻微。
  • 0.21-0.40:表示评估者之间的一致性程度中等。
  • 0.41-0.60:表示评估者之间的一致性程度显著。
  • 0.61-0.80:表示评估者之间的一致性程度很好。
  • 0.81-1:表示评估者之间的一致性程度非常好。

心理计算Cohen's kappa的优势包括:

  1. 考虑了评估者之间的随机一致性,可以减少因偶然性一致性而导致的误判。
  2. 考虑了评估者之间的偏差,可以评估评估者的一致性水平。
  3. 可以用于评估多个评估者之间的一致性,而不仅仅是两个评估者。

心理计算Cohen's kappa在许多领域都有广泛的应用场景,包括但不限于:

  1. 医学诊断:用于评估医生之间的诊断一致性,判断医生的诊断准确性。
  2. 机器学习模型评估:用于评估不同模型之间的分类一致性,判断模型的性能优劣。
  3. 社会科学研究:用于评估研究者之间的数据分类一致性,判断研究结果的可靠性。

腾讯云提供了一系列与心理计算相关的产品和服务,包括但不限于:

  1. 人工智能服务:腾讯云提供了丰富的人工智能服务,如图像识别、语音识别等,可以用于辅助心理计算中的数据分类和分析。
  2. 数据库服务:腾讯云提供了多种数据库服务,如云数据库MySQL、云数据库MongoDB等,可以用于存储和管理心理计算中的数据。
  3. 云原生服务:腾讯云提供了云原生服务,如容器服务、容器注册中心等,可以用于部署和管理心理计算相关的应用程序。

更多关于腾讯云相关产品和服务的介绍,请访问腾讯云官方网站:腾讯云

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

用混淆矩阵计算kappa系数「建议收藏」

从一篇论文——融合注意力机制和高效网络的糖尿病视网膜病变识别与分类,看到人家除了特异性、敏感性、准确率、混淆矩阵以外,还用了加权kappa系数,所以了解一下kapp系数的知识,加权kappa还没找到更好的资料。。。 资料来源于百度百科词条——kappa系数 Kappa系数用于一致性检验,也可以用于衡量分类精度,但kappa系数的计算是基于混淆矩阵的. kappa系数是一种衡量分类精度的指标。它是通过把所有地表真实分类中的像元总数(N)乘以混淆矩阵对角线(Xkk)的和,再减去某一类地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果,再除以总像元数的平方减去某一类地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的

01
  • Nature子刊:用于阿尔茨海默病痴呆评估的多模态深度学习模型

    在全球范围内,每年有近1000万新发痴呆病例,其中阿尔茨海默病(AD)最为常见。需要新的措施来改善对各种病因导致认知障碍的个体的诊断。作者报告了一个深度学习框架,该框架以连续方式完成多个诊断步骤,以识别具有正常认知(NC)、轻度认知障碍(MCI)、AD和非AD痴呆(nADD)的人。作者展示了一系列能够接受常规收集的临床信息的灵活组合的模型,包括人口统计、病史、神经心理学测试、神经影像学和功能评估。然后,作者表明这些框架与执业神经科医生和神经放射科医生的诊断准确性相比具有优势。最后,作者在计算机视觉中应用可解释性方法,以表明模型检测到的疾病特异性模式可以跟踪整个大脑的退行性变化的不同模式,并与尸检时神经病理学病变的存在密切相关。作者的工作证明了使用既定的医学诊断标准验证计算预测的方法。

    03

    BRAIN:用于阿尔茨海默病分类的可解释深度学习框架的开发和验证

    阿尔茨海默症是全世界痴呆症的主要病因,随着人口老龄化,患病负担不断增加,在未来可能会超出社会的诊断和管理能力。目前的诊断方法结合患者病史、神经心理学检测和MRI来识别可能的病例,然而有效的做法仍然应用不一,缺乏敏感性和特异性。在这里,本文报告了一种可解释的深度学习策略,该策略从MRI、年龄、性别和简易智力状况检查量表(mini-mental state examination ,MMSE) 得分等多模式输入中描绘出独特的阿尔茨海默病特征(signatures)。该框架连接了一个完全卷积网络,该网络从局部大脑结构到多层感知器构建了疾病概率的高分辨率图,并对个体阿尔茨海默病风险进行了精确、直观的可视化,以达到准确诊断的目的。该模型使用临床诊断的阿尔茨海默病患者和认知正常的受试者进行训练,这些受试者来自阿尔茨海默病神经影像学倡议(ADNI)数据集(n = 417),并在三个独立的数据集上进行验证:澳大利亚老龄化影像、生物标志物和生活方式研究(AIBL)(n = 382)、弗雷明汉心脏研究(FHS)(n = 102)和国家阿尔茨海默病协调中心(NACC)(n = 582)。使用多模态输入的模型的性能在各数据集中是一致的,ADNI研究、AIBL、FHS研究和NACC数据集的平均曲线下面积值分别为0.996、0.974、0.876和0.954。此外,本文的方法超过了多机构执业神经科医生团队(n = 11)的诊断性能,通过密切跟踪死后组织病理学的损伤脑组织验证了模型和医生团队的预测结果。该框架提供了一种可适应临床的策略,用于使用常规可用的成像技术(如MRI)来生成用于阿尔茨海默病诊断的细微神经成像特征;以及将深度学习与人类疾病的病理生理过程联系起来的通用方法。本研究发表在BRAIN杂志。

    01

    额叶-小脑连接介导认知加工速度

    加工速度是理解认知的重要概念。本研究旨在控制任务特异性,以了解认知加工速度背后的神经机制。对40名被试执行两种方式(听觉和视觉)和两种水平的任务规则(相容和不相容)的注意任务。block设计的功能磁共振成像在任务过程中捕捉到了BOLD信号。参考公开的用于处理速度的任务激活图,定义了13个感兴趣区域。认知速度是从任务反应时间得出的,这产生了六组连接性测量。混合效应LASSO回归显示,有六条重要路径提示了小脑-额叶网络预测认知速度。其中,3例为长程(2例额叶-小脑,1例小脑-额叶),3例短程(额叶-额叶、小脑-小脑和小脑-丘脑)。长距离的连接可能与认知控制有关,而短距离的连接可能与基于规则的刺激-反应过程有关。揭示的神经网络表明,按照任务规则执行操作,自动性与自上而下努力控制注意力相互作用,解释了认知速度。 1 简述 本研究旨在通过使用一系列简单的视觉和听觉通道的刺激-反应(S-R)映射任务来解决可能的任务相关偏差。这个多任务设计目的是解决上面提到的特定于形态和功能偏向的。箭头任务最初是一种视觉S-R兼容性任务,为了更好地控制所需的感觉运动处理时间,回答涉及到关于所看到或听到的内容的简单反应,箭头任务后来被改编成视觉和听觉形式(图1)。为了减少任务转换效应和交叉试验的不确定性,我们采用了分组设计,而不是与事件相关的设计。此外,我们的目标是解决以前的研究中的方法论缺陷,这些研究利用皮尔逊的相关性和心理生理学相互作用(PPI)来建立基于连接性的模型来预测加工速度。在这项研究中,我们建立了六个连通性指标,包括四个基于多变量的指数,用于进行模型比较。通过将控制任务的反应时与控制感觉运动成分的实验任务的反应时进行回归,构造了一个认知速度变量。功能关联性模型的建立基于混合效应套索回归。据我们所知,本文在该领域首次采用跨通道多任务设计,并比较了6种方法对区域间交互作用辅助处理速度的建模结果。 2 方法 2.1 被试 从当地社区招募了40名年龄在18-28岁的健康年轻人参与研究。他们都有高中或以上学历。最终样本包括35名参与者(21.5±2.1岁,14名女性),其中5名参与者被排除在分析之外。 2.2 处理速度任务 箭头任务被用来测量加工速度。它包括一个双选择S-R映射任务,具有相容(COM)、不相容(INC)和简单RT控制条件(NEU)(图1)。在COM中,参与者在出现向上箭头时按下“向上”按钮,在出现向下箭头时按下“向下”按钮(图1)。在INC中,参与者按下“向上”键表示向下箭头,按“向下”键表示向上箭头。实验涉及参与者在观看一条没有箭头的垂直线时按下任何按钮。因为在这些条件下出现的刺激是视觉图像,所以它们被称为COMVIS、INC-VIS和NEU-VIS。相同条件的听觉版本是COM-AUD、INC-AUD和NEU-AUD,向上箭头、向下箭头和垂直线分别被高音、低音和中音代替。

    01

    这款腕带型智能“小空调”,可以提供带节奏的渐进式热传递 | 黑科技

    消费者的腕带只是一个开始,未来,温控技术将在娱乐、虚拟现实和各种通信应用中使用。 生活中,对于我们来说,有时感觉冷,有时又会觉得热,这一情况再为常见不过。即便我们的祖先发明了空调,也没有办法规避这一让人略有不适的状况的出现。 针对这一问题,在2013年,MIT的四名工程学的学生发明了一款名为Wristify的智能腕带,该腕带通过与手腕上皮肤的接触来传递热度或凉爽,以帮助使用者取暖或降温。现在,经过多年的研发与完善,研究人员表示,该智能腕带产品几近完成,并将于明年正式售卖。 智能腕带 这款腕带,现在更名为Em

    00

    GEE好文推荐——利用样本点迁移方法快速实现全球范围内1984年至今基于Landsat影像的土地分类

    在本研究中,我们在 GEE 中实施了射频分类器,利用 Landsat-8 和 Sentinel-2 数据集对 2022 年植被生长季节的不同空间尺度进行了时间序列土地分类。我们的首要目标是利用多源遥感变量构建的不同土地分类模型,为时间序列数据集建立一个高效、准确和通用的土地分类模型,并根据未发生土地分类变化的样本点图像值差异,确定土地分类样本点和迁移阈值。我们的目标是 (1) 确定基于土地分类无变化的样点迁移阈值;(2) 根据阈值分析使用陆地卫星遥感图像和高精度哨兵图像的 36 年时间序列制作的土地分类模型的准确性;(3) 确定基于多源遥感变量不同组合的最佳射频土地分类模型,并比较图像分辨率对分类准确性的影响。

    01
    领券