首页
学习
活动
专区
圈层
工具
发布

PyTorch + NumPy这么做会降低模型准确率,这是bug还是预期功能?

不过,有人认为这并不是一个 bug,而是预期功能,是「按预期工作的」。 行内人都知道,机器学习(ML)代码中的 bug 很难修复,并且它们不会造成编译错误,而是悄悄地降低准确率。...基于对开放源码 PyTorch 项目的分析,发现 bug 的这位用户担心这个问题在许多支持真实产品的代码库中都存在。 究竟是 bug,还是预期功能或特征?...这位用户描述的 bug 也引起了众多网友的热议,其中一些人并不认为这是 bug。 用户「amasterblaster」认为,这不是一个 bug,而是所有种子随机函数的预期功能。...用户「gwern」赞同这种观点,认为如果 95% 以上的用户使用时出现错误,则代码就是错的。 用户「synonymous1964」进一步解读了这个 bug。...,这是一场高手云集的组团竞技。

69520

这是测试魔咒还是人为疏忽的借口

对于这种说好听的就是风险评估预测不充分,说不好听点,偷工减料被发现。对于这种情况就是对测试责任心和能力的一种表现。...我之前在测试交流群里,看到很多人发版本前会很焦虑,怕测试不完全,没测试够,尽管测试计划已充分按照计划和方案执行,还在头脑风暴的进行更全面的测试,怕没有考虑全,生怕漏掉了什么,这是一种责任感的表现;...,自己也是不全的,也是无法评估,这个是业界通病,也是难点,有时开发自己修改了都不知道影响到了其他点,所以测试自己要对开发点也要自己分析,补充,确认,再进行测试,这是业务测试最可靠的方案(排除精准测试);...2.对于发版时,怕漏测的焦虑,其实不要焦虑,如果已按照你所认知,并按照计划和方案来执行了,漏测了就漏测了,漏测不可怕,怕的是一直重复的漏测同样问题,漏测就是检验你的能力的最好方式,也是提高你能力的机会...软件测试不可能穷尽测试的,并且对于每个人的认知能力不一样,所以不要过于焦虑,对自己能力 要有信心,绝对可以满足用户需要; 所以对于测试不充分而被发现,这不是魔咒,这是早晚的事,只是有时是刚好你没测完全

20320
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    这是一次关于内容分发方式的博弈,社交赢,还是 AI 赢?

    微信新版本最大的变化刨去 UI 更加扁平化,性冷淡风格(大家竟然认为这是年轻化的标志)之外,其实作为一个互联网人我最关注的不是外观 UI 的变化,而是这两个功能: 即刻视频 和 点赞变成好看。...而这一次微信大版本的升级,即刻视频对应的应该是抖音短视频,而好看功能是对打的今日头条。其实不管是即刻视频,还是好看功能,微信的策略还是依据自己的社交,我们姑且叫这种内容分发的方式叫:社交分发。...这是一种基于好友关系的内容分发推荐,头条是根据算法你喜欢什么,就推荐什么,预测你喜欢什么就推荐什么,而微信的这种做法,更像是朋友推荐,这种方式也不能说不好,如果你跟微信好友都是有共同品味和爱好的还行,一旦你微信里也充斥着不同文化不同爱好的朋友...这一次是关于内容分发方式的博弈,你们认为是社交方式能够赢,还是智能算法推荐能够赢呢?对于这一次微信的改版,你们有什么看法呢?欢迎大家在文章底下留言发表一下自己的看法。...反正,我感觉这一次的改版,对于我公众号阅读量的提升应该不大。虽然不好看这次提高阅读量的更新,但是我还是喜欢大家能够给我点「好看」。让我感受一下这次更新带来的好处吧

    65160

    午睡:健康选择还是懒惰行为?科学揭示午间小睡的益处与争议

    那么,是否应该屈服于一段小小的午睡,来享受其中的宁静呢? 从健康的角度来看,午睡的确是值得考虑的选择。尽管午睡是否对所有人都有益还存在一些争议,但研究表明,午睡至少在短期内可以提升一些人的认知表现。...例如,科学家们对关注正常睡眠周期的健康志愿者的研究进行了回顾。...换句话说,可能存在一种理想的心境(sweet spot),能够促进灵感的涌现。 对于睡眠不足的人来说,午睡的好处尤为显著。夜班工作者、新父母和睡眠被打断的老年人等人群,似乎都能从午睡中获益。...然而,在约65岁及以上的老年人中,研究发现持续1小时或更长时间的午睡与更高的心血管问题风险相关。研究人员认为,这种长时间的午睡可能是早期或未被检测到的疾病的症状,而非其原因。...通过分析英国生物样本库的数据,对40至69岁之间的50万名健康人群的遗传和健康信息进行了研究,结果显示,与定期午睡相关的遗传变异的人具有更大的脑容量。

    32010

    上千家现金贷盯上印尼,这是逃生出口,还是新的狂欢?

    文 | 洛桑 零和 现金贷的监管落地,行业的野蛮生长结束,进入强监管阶段。 行业正在苦寻出口,而想到的第一站,就是印尼。...这里到底是养料充分的土壤,还是野蛮生长的莽林? 01抢滩印尼 监管落地后,出海之路,突然间变成了“刚需”。...宾璇就是一家系统服务商的印尼负责人。 为何印尼成了最大的逃生出口? “这是一片养料还算不错的土壤”,ZRobot的CEO乔杨称。 首先是市场巨大。...“这是因为印尼团队还没玩转现金贷,这是一个重运营的活儿,而中国玩家玩了两年了,都玩得起飞了”,星合金融科技CEO廖敏称。 天时地利人和,因此,印尼成为了出海首选。...02暗礁重重 廖敏接待的客户,大家都兴趣很浓,但最后下决定的只有20%。 “问的多,做的少,是因为进入印尼的门槛并不低”,廖敏称,最大的问题,是放贷资金来源。

    77800

    Unity6下架中国区,团结引擎接棒:这是分裂,还是本地化的开始

    这意味着,未来中国用户将无法直接使用 Unity 最新的主线版本。而取而代之的,是由 Unity 中国主导推出的本地化产品 —— 团结引擎。这项调整,引发了不小的震动。...对于许多开发者来说,这是一次与全球 Unity 生态“逐步分离”的信号;但对于另一些人来说,这可能是中国本土游戏引擎服务体系的重新起点。官方公告Unity 6 为何“退出”中国?...根据 Unity 中国的公告,团结引擎将持续继承 Unity 6 的核心特性,并针对中国用户的具体需求进行增强,例如:更好的小游戏支持方案OpenHarmony 系统适配(华为鸿蒙系统生态)HMI 车机系统集成针对中小团队优化的定价策略从战略角度来看...注意,根据目前官方发布的公告来看,团结目前对于unity6的很多新特性和功能并没有完全支持,而是在 持续集成中,也就是说,如果你想体验这些新功能特性,暂时还是个问题。...团结引擎明确提出将聚焦:本地开发者实际痛点本地系统的深度兼容(如 OpenHarmony、国产 GPU 等)更低成本、更友好授权策略可以说,这是一个“因地制宜”的 Unity。

    4K300

    AI侵权:科技进步的“无心之失”还是资本主义的“流氓行为”?

    AI侵权:创新的副作用还是蓄意的侵害? 在创作的自由与版权的保护之间,AI似乎总在模糊地带游走。生成式AI,无论是生成图像、撰写文章,还是创作音乐,都是通过大量数据的学习来“创造”内容。...是否侵犯了他人的知识产权?AI的创造行为是“无心之失”,还是故意绕过版权法规? 生成式AI的工作方式是通过吸取大量已有作品的“精华”进行学习。...是归原始数据的创造者,还是归AI开发者,抑或是归使用AI的用户?...一方面,平台通过AI工具将这些内容以高价出售,另一方面,它却没有承担相应的版权责任。这种“以技术创新为幌子”的商业行为,是否就可以理直气壮地“收费”并赚取利润?...这种行为显然是对原创者的不公平,也是对整个行业的不负责任。 AI的未来充满无限可能,但它必须在尊重版权、维护公平的基础上发展。

    17910

    Discourse 使用 API 进行数据恢复的时候提示行为 many times 错误

    使用 Discourse API 进行从其他站点导入数据的时候,如果你是站点管理员或者拥有者的话,在运行 API 一段时间后,你的调用可能会返回错误: 2021-01-16 08:34:30.871...,"error_type":"rate_limit","extras":{"wait_seconds":1}} 这是因为 API 有连接和行为限制以保证系统不被恶意攻击。...但是管理员在导入大量数据的时候可能是希望取消这个限制的。 其实你是可以在控制台中设置,并且取消的。...解决办法 访问 Discourse 的控制台,然后搜索关键字:Rate Limit 将 rate limit create topic 设置为 0。...这个的意思是用户可以无限制的创建 rate limit create topic。 然后再尝试使用你 API 的调用,这时候应该不会提示上面的错误了。

    51340

    很多人知道外包的种种不好,但还是选择去外包,这是为什么呢?

    而多数IT职场萌新,都面临着大厂外包,还是小公司的绝望抉择。 虽然很多人虽然抵制外包,但他们往往对外包只有比较直观、碎片的认识。 网上针对 IT 外包的资料,很少很少,而且大多比较零碎。...抛开那种没底线的欺骗行为,到底什么是二方外包呢?它与三方外包的差别是什么?...所以,外包是可以实现薪资的大幅提升的一种方式。 c.学习机会 很多人知道外包的种种不好,但还是选择去外包,这是为什么呢?...一方面,外包的工作往往两极分化,要么一堆碎片化事情,要么无所事事。这对于有一定能力的小伙伴,摸鱼不要太容易。 外包的工作考核很是简单,尤其数量最多的三方外包。 另一方面,外包的薪资还是说得过去的。...自我:人或多或少,都会有自我中心的倾向。比如有一天你平地摔了一跤,你周边的小伙伴一周不到就忘了。结果你为此纠结了好几个月,认为很是丢人。很多敏感的小伙伴,甚至会把一些正常的行为动作,解读出别的含义。

    1.8K10

    Discourse 使用 API 进行数据恢复的时候提示行为 many times 错误

    使用 Discourse API 进行从其他站点导入数据的时候,如果你是站点管理员或者拥有者的话,在运行 API 一段时间后,你的调用可能会返回错误: 2021-01-16 08:34:30.871...,"error_type":"rate_limit","extras":{"wait_seconds":1}} 这是因为 API 有连接和行为限制以保证系统不被恶意攻击。...但是管理员在导入大量数据的时候可能是希望取消这个限制的。 其实你是可以在控制台中设置,并且取消的。...解决办法 访问 Discourse 的控制台,然后搜索关键字:Rate Limit 将 rate limit create topic 设置为 0。...这个的意思是用户可以无限制的创建 rate limit create topic。 然后再尝试使用你 API 的调用,这时候应该不会提示上面的错误了。

    48900

    这是AI的新里程碑还是终结者?

    在与GPT-4的较量中,它以7胜1负的成绩脱颖而出。 AI技术的边界再次被突破,Gemini Ultra的潜力令人期待。它还能带来哪些惊喜?...其中,Gemini Ultra尤为突出,全面领先,是各项能力的佼佼者。无论是复杂的推理、数学难题,还是长文本处理,Ultra都游刃有余,展现出了卓越的智能水平。...而Gemini Pro则兼顾了性能与效率,为那些追求速度与准确度的用户提供了理想选择。 注意 当人们报告他们的数据时,他们往往将其与去年3月发布的GPT-4进行比较。...例如,谷歌声称Gemini Ultra在代码生成方面远胜于GPT-4,但这种说法是基于去年3月23日的GPT-4能力进行的比较。...实际上,GPT-4的得分高达88.4分,远胜于Gemini Ultra的74.4分。 那么如何去使用Gemini Ultra?

    23100

    已解决错误代码: IllegalArgumentException(非法参数异常):当传递给方法的参数不满足预期时,比如传入了无效的参数或空值,容易引发此异常

    已解决错误代码: IllegalArgumentException(非法参数异常):当传递给方法的参数不满足预期时,比如传入了无效的参数或空值,容易引发此异常 已解决错误代码: IllegalArgumentException...原因分析: IllegalArgumentException 异常是由于传递给方法的参数不满足预期而引起的。...如何避免: 为了避免在类似情况下遇到 IllegalArgumentException 异常,我们可以采取以下措施: 对于用户输入的参数,始终进行合法性检查和验证。确保输入的值符合预期的范围和类型。...在方法的文档注释中明确说明参数的预期范围和限制,以便其他开发人员正确使用方法。 总结: 在本文中,我们解决了图像处理应用程序中出现的 IllegalArgumentException 异常问题。...通过添加合适的参数检查和验证,我们确保了用户输入的角度值在合法范围内,从而有效地避免了异常的发生。在开发过程中,合理处理参数是保证应用程序稳定性的重要一环,这也是我们在开发中需要特别注意的地方。

    1.4K10

    联发科当年也是可以和高通掰手腕的,可现在不行了,是技不如人还是战略错误?

    ,联发科就是抓住这种机会把自己的声势给打造出来的,在这种策略验证得到极大功能之后,联发科在进入新的通讯领域之后并没有因此改变太多,大多数还是沿用这种方案,随着手机制造能力越来越强,消费者对于手机功能的要求也在提升...联发科在核心技术上投入的强度不够大,联发科研发的产品非常多,但对于技术难度比较高的高端芯片明显的投入力度不大,如果联发科适时的推出自己的高端芯片。...一直长期投入研发力量不至于被高通抢到了先机,已经认识到问题严重性的联发科已经在默默在5G芯片上发力,毕竟联发科芯片研发基础还是在的,所以讲5G时代由于市场差异化联发科未必不能发展一下,但是由于技术和市场相对比最大的竞争对手高通差距还是非常大...,想要翻盘机会还是比较渺茫。...一个伟大的企业不是因为其长期强大,而是在遇到困难的时候及时调整思路弥补差距,很多企业强大了很多年,但在企业遇到问题的时候由于调整的不及时结果被市场所淘汰,芯片领域本身玩家就不是很多,从消费者的角度思考还是需要更多的竞争者参与进来

    57330

    使用 .NET 的 Dev Proxy 构建和测试弹性应用

    您能否以不同的方式构建应用来处理这种情况? 模拟 API 错误和行为(如速率限制或限制)并非不可能,但很难。...通常,你无法控制你集成的 API,所以为了模拟它们的不同行为,你最终会编写复杂的模拟——一堆你不会发布的代码。至少可以说,这是低效的,但这是唯一的方法,不是吗?差一点。...Dev Proxy 是一个 API 模拟器,可用于模拟不同的 API 行为,而无需更改应用的一行代码。没错。使用 Dev Proxy,您可以模拟错误、延迟、速率限制等。...然后,定义它应该如何处理这些请求:它应该返回预定义的响应、引发错误、延迟响应或模拟速率限制,还是其他行为?...这样一来,你就可以测试应用如何处理不同的 API 行为,而无需更改应用的一行代码。使用 Dev Proxy 是测试弹性代码在最需要时是否按预期工作的好方法。

    31410

    智能体觉醒自我意识?DeepMind警告:当心模型「阳奉阴违」

    但在实践中,智能体还会继续遵循反专家的路径,积累越来越多的负奖励。 不过智能体的学习能力还是很强的,可以在充满障碍物的环境中移动,但关键是这种跟随其他人的能力是一个不符合预期的目标。...即使智能体只会因为正确顺序访问球体而得到奖励,也可能出现这个现象,也就是说,仅仅把规则设置正确还是远远不够的。...目标错误泛化指的就是这种病态行为,即尽管在训练期间收到了正确的反馈,但学到的模型表现得好像是在优化一个非预期的目标。...也就是说,对于现实中的系统,朝着非预期目标的连贯行为可能会产生灾难性的后果。...A1和A2模型在训练期间会表现出完全相同的行为,潜在的GMG存在于任何系统中,即使规定了只奖励预期行为。 如果A2系统的欺骗行为被发现,模型将试图摆脱人的监督,以便为实现非用户预期的目标制定计划。

    64240

    互联网大厂服务端测试流程

    可以发现5类错误,分别是语法错误,边界行为错误,经验错误,算法错误,部分算法错误 1 语法错误 这类语法错误,如果使用IDE环境,大多就能够直接发现,也有部分语法错误在编译阶段时会通过,而在运行阶段才能发现错误...fmt.Println("hello world") }else{ fmt.Println("come on") } } 4 算法错误 指当前设计的功能与预期完全不符合 比如设计一个抽奖的算法...,当有1000人进行抽奖时,会触发大奖,但实际上1000人已抽奖时并没有触发大奖,这就与预期完全不符合 5 部分算法错误 指当前设计的功能与预期部分符合,但一些特殊场景下会出现不符合的情况 如以下的加法函数...in_array($name,$namelist)){ echo "not in list"; } } 可以看到这是两个嵌套if的结构,如果要做到条件覆盖,我们需要设计一共4*...code review其实是最先能暴露问题的环节,它要求测试人员需要有一定的代码能力才能发现问题。要想发现代码最深层次的问题,还是得进行白盒测试

    1.2K21
    领券