您的位置:首页 > 热点专题

「Ta在」团队打造首款以实现全球脑为目标的KNS产品

时间:2020-01-31

在5G时代,ECI算法将能够吸收更多的知识和经验。凭借低延迟和更快的传输速度,云服务器将能够像本地中央处理器一样快速地处理数据。加上可穿戴设备和其他IOT设备的普及,全球大脑将能够发挥更大的作用。“塔仔”已经开始与几个中国帆船队合作,讨论如何将ECI算法嵌入到这些队的内容推荐和电子商务系统中,以改善转型。“我们如何才能让人类变得更聪明?”面对第一颗原子弹的爆炸,曼哈顿计划的创始人万尼瓦尔布什(Vannevar Bush)正在思考这个问题。

那是1945年7月。在新墨西哥州的沙漠中,一枚相当于20,000吨梯恩梯的核武器在离地球表面近10,000米的地方爆炸了一个巨大的蘑菇云,在沙漠中留下了一个10米宽的陨石坑。一个月后,广岛和长崎出现了同样的陨石坑。第二次世界大战结束了。

九名科学家参加了爆炸测试。看到如此壮观的景象诞生在他们自己的手中,科学家很难不表达一些感情。然而,7月蘑菇云升起时,布什给《大西洋月刊》送去了一封与原子弹无关的信。在这篇题为《诚如我思》 (As We May Think)的文章中,布什提出了一个悲观的结论:“人类获得的经验正以快速的速度增长,我们从知识迷宫中获取信息和知识的方式和我们过去建造帆船时一样巨大。”“这样一个巨大的问题源于布什管理曼哈顿计划的经验。战前,科学家们独自在实验室里挑战特定领域的难题。曼哈顿计划正好相反:国家力量将物理、化学、材料和其他学科的科学家聚集在一起,分享各自领域的前沿知识,并进行团队合作。布什担心战争即将结束。这种思维合作能继续下去吗?

生物通过合作进化出更高级别的代理。这不是美国的倡议,而是永恒的自然法则。以蜜蜂为例:每个人的智商不高,但通过小组合作可以建立一个完美的巢穴。那么在19世纪,着名科学家尼古拉斯?特斯拉预言有一天世界会认识到全人类思想的联系。地球变成了大脑,每个人都是神经元。

预言毕竟是一个预言。借助人脑中的生物电,信息在神经元之间传递。然而,从人脑中分离信息并在不同的群体、学科和主题之间自由移动显然太困难了。布什认为,在信息的获取、存储和连接方面存在着深刻而具体的问题:最优质的信息首先无法到达最需要它的人手中;在信息存储方面,我们仍然依赖经典的卡片转录和百科全书。如果我们不重新思考人与信息之间的关系,并借助计算机提高上述联系的效率,全球大脑的想法将成为空中楼阁。

布什在《诚如我思》年提出的困惑指出了整整一代计算机和互联网发明家的目标。原子弹爆炸74年后,我们让机器在获取和存储信息方面发挥了重要作用。搜索引擎、内容分发算法和社交网络让每个人的闲暇时间都迅速充满各种信息。无论是圣母院大火还是明天的人数限制,我们都很清楚。

然而,我们在信息连接方面仍然没有取得太多突破。人类有自己的思维方式。当大脑获取一条信息时,它会立即将其与另一条信息联系起来。布什对此非常赞赏,并写道:“人类行为的速度、思维轨迹的复杂性和微妙的想象力正是机械化指数所不能做到的.人类不能指望人工完全再现心理过程,但是人类当然可以从这个过程中学习。“

当我们以此为标准,回顾过去几十年互联网的变化,我们会发现它越来越偏离“信息连接”的初衷。少数人设置的标注算法限制了人们自由探索知识边界的能力。更多的内容,而不是提升我们的认知,会让我们因为信息过载而感到焦虑。

为什么会有这个问题?

社交媒体无法解决知识共享问题

如果我们把人与信息之间的互动分为三个环节:获取、存储和联系;计算机在前两个链接中似乎做得很好,但它对连接无能为力。事实上,这种无能恰恰是因为计算机在帮助人类获取和存储信息方面做得不够。

目前,用户从互联网上获取信息的方式有很多,包括知识系统(如维基百科、百度百科等)。),推荐系统(今天的头条,一些信息,等等。)和搜索系统(谷歌、百度等)。)。不同系统的基本逻辑是不同的:

-知识系统基本上使用基于条目的系统来创建和维护条目和知识点

-推荐更多的是基于内容或用户之间的关联来选择用户可能感兴趣的内容

-搜索本质上是基于关键字和内容之间的匹配程度来呈现结果。

尽管上述系统取得了巨大成功,但它们也遇到了自身的问题和发展瓶颈。主要原因是这些系统是由少数人执行的,自上而下的知识传播并不使用所有人的大脑。

让我们先看看“知识网站”,包括知识系统和社交媒体。它们的优点是信息粒度低,可以覆盖大量内容。缺点也很明显。一是不断涌现的新知识点的编译和维护非常费力和乏味,并且容易产生遗漏。其次,它们不能根据知识的变化和相互关系进一步进化和自组织。

这种情况在实际使用中非常明显。维基百科不能发现和处理新知识,只能依靠用户创造新知识。另一方面,智虎被动地吸收知识,需要有人提问来建立新的知识点。这是因为用户UGC生成的内容包含多种含义。机器很难理解内容本身,更不用说难以用语言清楚描述的意识和感觉知识,然后抽象知识之间的联系。

除了知识网站之外,今天许多用户还依赖与今天标题相似的推荐系统来获取信息。这些系统大多使用固化的神经网络。为了建立人与机器之间的联系,该算法将建立一种标记机制。内容由自然语言处理模型手工编辑或标记,基于协同过滤的算法使用户和标记产生映射关系。这种方法的问题在于,它依赖一维标签来描述用户,因此有时结果是非理性的、扭曲的或扭曲的,往往会放大用户对特定内容的好恶。此外,许多高质量的内容可能不包含清晰的标签,如音频、视频、图片等,这些内容甚至更难用关键词来描述。

最后一类是基于关系链的社交媒体,如微博和脸书。这种产品仅依靠用户的共同利益进行信息传递,但由于缺乏系统的知识结构作为支撑,它只能基于人际关系链恢复人与人之间的物理联系,很难在表达个人思想和知识上进行沟通。

例如,我想在微博上了解日本文化,但唯一的方法是关注“日本文化博客”。他的确发布了很多令我感兴趣的内容,但他经常分享他的个人生活,这让我信息超载。

此外,受交通理论的支配,关注一个人越来越不是因为双方有共鸣,而是因为对方有更多的发言权。与“人人都可以同时举起手臂大喊大叫”的论坛相比,脸书和微博等社交网络使用伙伴和粉丝来限制信息传播,甚至可以通过商业手段进行推广。这使得它们不再是传播思想和内容的公平平台。当社会属性变得越来越强时,知识属性变得越来越弱。

因此,我们可以用获取信息的方式总结几个问题:

-信息过于依赖(少数)人传播,导致推荐质量下降

由于这些原因,现有的工具只能作为“信息源”。本质上,它们是以机器为中心的,而不是以人为中心的,不会与我们的有机思维过程相冲突。不管是智虎还是维基百科,它们更像是由超高速中央处理器编译的字典,是大量“机械化索引”的集合。

作为用户,我们希望工具能代替我们去做“脏活”,比如搜索和搜索,这样我们就有更多的时间去理解和消化新知识。这就要求这些工具能够尽可能符合人们的思维方式,并且像人一样寻找、编辑、联想和思考。

没有人,信息有可能在互联网上自由传输、碰撞和连接吗?用户无需关注某人就能获得准确的信息。信息发布不再需要贴标签、由博客作者转发和志愿者维护,而是由吸收集体智慧的“全球大脑”决定。这个“全球大脑”可以在每个人的帮助下进行独立的进化和成长,理解信息和信息之间的关系,实现真正的联系。

KNS知识网

自2015年以来,“Ta in”团队已经开始在美国创建一套新的算法来解决上述问题。在这套名为ECI的进化群体智能算法下,人们可以不基于认知等社会关系而相互联系,而是通过大脑的知识特征和兴趣属性来自动建立联系,构建超越个体智能的群体智能。完成这套算法后,该团队于2018年11月推出了全球首个旨在实现全球大脑的KNS(知识网络服务)产品“Ta in”。

ECI算法的一大优势是自进化。这是目前大多数信息获取方法的弱点。例如,亚马逊和淘宝等电子商务公司基于标签系统,标签系统根据用户看到的产品生成新的推荐。这种方法更像是识别用户购买行为并推测用户可能喜欢什么的机器(以及它后面的有限数量的程序员)。这种机器逻辑有时会导致非常糟糕的用户体验,例如根据用户购买的产品一遍又一遍地向他们推荐所有类似的产品。

ECI算法的内容分发逻辑是基于许多人的判断,而不是通过本地个人的好恶(如逻辑和内容审阅者)。它将学习大量用户的使用习惯,然后将信息分发给单个用户,然后根据用户的反应修正系统判断并推给用户,从而反复学习。在长期的相互判断过程中,ECI算法不断进化,以达到增强群体智慧的目的。

每个人都会享受平台上每个人的判断和贡献。最直观的例子是,每个“Ta in”帖子下的相关建议都是动态的,会在很长一段时间内不断演变,并根据团队的协同判断不断变化和调整,从而变得越来越全面和准确。

对应于这种动态算法,是一种具有相同进化的知识分类。现有的社交网站要么依靠人工编辑进行分类,要么依靠内容发布者有意识地进行标记和分类。这显然是现实中的妥协:一部电影可以分为许多类别,每一个类别都非常复杂多样,所以显然不可能通过手工来准确识别标志。

“ta in”使用ECI算法来识别内容。相同的内容可以分为多个标签维度(知识属性维度),并且这种分类总是处于进化状态。它消除了内容埋藏太深而无法找到和连接的问题。该平台总是能够以极大的灵活性检索内容。

充分利用这种进化分类优势的最佳方式是通过问答和知识检索产品。现有平台的最大缺点在于,当问题开始时,必须首先找到对应问题的特定分类下的响应者。这无疑是违反直觉的。

在ECI算法下,如果用户抛出问题或内容,算法会根据内容和问题的特征属性自动连接相应的内容或人,间接建立人与人之间的联系

当进化逐渐变得稳定时,就会形成稳定的知识结构和人际结构。ECI算法可以计算每个内容点、知识点和兴趣点与其他内容点知识点兴趣点之间的关系。他们有多相似?或者他们是相互关联的?当对这种关系进行越来越准确和清晰的分析时,Ta in最终将形成一个庞大的知识体系、知识地图和知识库。

那么,这个算法是如何进化到足够聪明的呢?为了解释这一点,塔仔为其全球大脑平台设定了一个名为CIQ的值,用来描述该平台的智能水平。目前,“Ta in”平台的CIQ值是18,这意味着它相当于一个智商为18的人。然而,即便如此,ECI算法也发挥了巨大的潜力。目前,“Ta in”的响应率很高,表明该算法将问题推给了对问题感兴趣甚至有经验的人。

当CIQ达到100时,“塔在”平台上的知识量相当于智湖。随着内容宽度的增加,该算法还可以更快地关联内容。当CIQ达到1000时,知识的数量就相当于谷歌的数量。在一篇文章被发送10-20秒后,瀑布流将有非常相似的其他内容推送。

除了自主进化和混合智能(结合人和机器的判断),ECI算法最重要的一点是充分利用用户规模,不断改善用户体验。对于其他社交平台来说,用户增长的边际收益正在减少。用户和内容的数量越大,点击内容后垃圾内容的数量就会越多。然而,在ECI算法下,用户数量越多,“全球大脑”作为分发引擎,将能够了解更多用户的使用习惯,提高智能,从而使推给用户的内容更加准确,垃圾内容也更少。

目前,“Ta in”团队已经验证了ECI算法在自己的内容产品中的威力。据该团队介绍,他们希望将该算法连接到外部平台,并以更轻的模式探索其在ToB场景下的潜力。

我们上面提到,许多现有的电子商务和内容平台利用标签系统来推荐内容,并且缺乏自我进化和学习的能力。一方面,它使平台的B端缺乏消费洞察力,无法提高购买转化率。另一方面,它使用户经常收到垃圾信息,造成信息过载。

几年前,“瓮”的消息在某种程度上引起了轩然大波。一名用户无意中在淘宝上搜索了该产品,但系统在一段时间后反复向他推荐类似的产品。归根结底,这是因为淘宝背后的推荐算法不明白什么是产品“瓮”:它的功能属性和使用频率。

ECI算法将避免这样的错误,因为它真正了解每种产品是什么,并能根据用户的情况和兴趣提出建议,这样推荐引擎就能真正帮助用户,而不是垃圾信息生产者,来推广真正的购买。随着购买量的增加,电子商务平台电子商务平台可以根据用户的消费心理得到更多的洞察,如计算前所未有的商品关系,实现创新的商品推荐,更有效地刺激联合消费。换句话说,亚马逊可能只推荐尿布旁边的奶粉。然而,根据ECI算法,它可能会推荐啤酒和其他爸爸感兴趣的产品。

在5G时代,ECI算法将吸收更多的知识和经验。凭借低延迟和更快的传输速度,云服务器将能够像本地中央处理器一样快速地处理数据。加上可穿戴设备和其他IOT设备的普及,全球大脑将能够发挥更大的作用。

以教育行业为例。正如我们上面提到的,ECI算法使“技术援助”产品中的技术援助问答模块非常活跃,因为它可以连接和扩展知识点。这条道路也可以应用于其他教育产品,成为5G时代的重要应用。

众所周知,视频是许多教育产品的主要形式,视频内容的结构化非常困难,还处于人工标注和目录系统阶段。随着数据传输速度的加快,视频可以被全球大脑学习和分发。该产品将真正打破现有的统一

目前,塔仔已经开始与几个中国帆船队合作,讨论如何将ECI算法嵌入到这些队的内容推荐和电子商务系统中,以改善转型。与以前的全球脑产品“Ta in”不同,这些外部合作将成为ECI算法的热点。该团队希望以较轻的方式与外部产品合作,例如技术股票和股息。只有这样,ECI算法才能进入更广阔的世界,吸收更多人的知识和经验,从而不断提高算法的智能性。

计算机科学家艾伦凯曾经说过:“起初,最好的工具可以激发人类的创造力。”借助理解自我进化和学习的ECI算法,知识不再无生命地随机堆积在硬盘的角落,而是可以自由流动和连接。这种联系肯定会给所有人带来更多的思考火花。到那时,“利用计算机提高人类智力”的日子终将到来。

日期归档
  • 友情链接:
  • 雨花台资讯网 版权所有© www.hcyxsq.cn 技术支持:雨花台资讯网| 网站地图