业务频谱是什么意思？-阅读《人工智能——李开复谈人工智能如何重塑个人、企业和社会的未来光谱》

关于知识图谱1的几个问题。为什么知识图谱对机器实现人工智能如此重要？

2.理解自然语言为什么需要知识图谱？

3.知识图谱为什么有很好的商业前景？

阅读《人工智能——李开复谈ai如何重塑个人、企业和社会的未来图谱》是时下非常热门的话题，尤其是2017年5月AlphaGo战胜李世石的事件，掀起了人工智能的热潮。人工智能的发展促使我们面临几个问题:什么是人工智能，它的影响是什么，如何应对？李开复先生作为人工智能领域的专家、行业推动者和思想布道者，通过这本书回答了我们的问题。这本书内容丰富，几乎涵盖了人工智能的方方面面，但感觉结构有点松散。总的来说，作为一本科普书，还是给了我很多启发。

一、什么是人工智能

人工智能的概念从计算机发明开始就被提出，图灵提出的图灵测试开始思考人工智能的发展并给出了测试方法。该书列举了历史上人工智能定义的演变。与定义的抽象相反，人工智能现在真的就在我们身边，比如智能助手、新闻推荐、机器视觉、AI艺术、新型搜索引擎、阿尔法狗等等。该书用Gartner的技术成熟度曲线来论证当前的人工智能热潮与过去有着本质的不同。实现了语音识别、机器视觉、数据挖掘等领域已经赶上甚至超过正常人类水平，突破了心理门槛，进入了真正的应用场景，并与商业模式紧密结合，在行业中发挥了真正的作用。

深度学习造就了现在的人工智能，是背后的关键技术。2006年，Jeffrey Hinton和他的合作者以一篇题为《深度信任网络的快速学习算法》的论文宣布了深度学习时代的到来。深度学习算法来源于人工神经网络技术，技术灵感来源于人类神经节沿着网状结构传递和处理信息的假设。历史上这项技术因为异或问题而停滞不前，直到1975年解决了这个问题，人们才发展出多层神经网络技术，2010年后逐渐成熟。

书中生动浅显地介绍了深度学习的神秘算法。从根本上说，深度学习和所有的机器学习方法一样，都是用数学模型对现实世界中的具体问题进行建模，以解决该领域类似问题的过程。用人类孩子学习认字的过程来类比，计算机要总结出单词的规律，未来看到类似的模式，根据之前总结出的规律知道什么是模式。这个过程被称为“计算机学习”。学习对象称为“训练数据集”。数据集中的数据用“特征”来区分，模型用计算机“建模”来概括。计算机学习有不同的算法，比如决策树。深度学习的特点是表达灵活，同时允许计算机不断尝试，直到接近目标。从数学的角度来说，深度学习和传统的机器学习方法没有本质的区别。两者都希望在高维空间中根据物体的特征来区分不同的物体，但是他的表达能力比传统的机器学习要好。具体来说，我们可以把学习对象看成是一大堆数据，把这些数据扔进一个包含多个层次的复杂数据处理网络(深度神经网络)，然后检查这个网络处理的结果数据是否符合要求。如果符合要求，我们将保留该模型，否则我们将继续调整它，直到输出符合要求。书中给出了水池阀门的例子。这种方式需要的是计算机近乎疯狂地以特定的方式调整所有的流量调节阀，不断地实验探索，增加层数和变量，增加计算能力，增加数据量，直到算出最佳模型。所以深度学习的基本指导原则是实用主义。

由此可见，深度学习算法有效发挥作用的前提一是芯片的计算性能和处理能力大幅提升，二是因为互联网长期发展带来的高质量海量数据。这两个条件成熟后，基于深度学习的人工智能会变得更强。

有点玄乎的是，深度学习算法很有效，但是模型做出来之后，模型的设计者也说不清楚为什么，因果关系是什么。史上最有效的机器学习方法被很多人视为“黑匣子”，这也会导致一个问题:人们开发出看不懂的程序，只知道它做过什么，却不清楚它掌握了什么样的规律，这个学习程序会不会失控？

第二，人工智能的影响

关于人工智能讨论最热烈的应该是科幻电影了，比如《黑客帝国》《龟壳里的幽灵》《我》《机器人》《终结者》。列表可以长时间讨论无数种可能性。简单分类，分为乐观和悲观的观点。

人工智能对我们是威胁吗？像这种设定的电影，人工智能的发展超出了人类的控制，人类被支撑，被奴役，或者被毁灭。我觉得真的是危言耸听。

书中对人工智能进行了分类:弱人工智能、强人工智能、超级人工智能。书中的观点是，我们现在能看到的是弱人工智能，即应用人工智能，专注于且只能解决特定领域的问题；强人工智能又称通用人工智能，可以胜任人类的一切工作，具有推理、策略、问题求解、决策、常识、规划、学习、交流等能力。在不确定的环境下，强人工智能可以代替人类。但在这里，强人工智能有“意识”吗？这个问题很复杂。如果人工智能有自我意识，那它和人类有区别吗？人和机器的关系不是人和工具的关系；超级人工智能，假设人工智能继续发展，可以比世界上最聪明最有才华的人都聪明。这个定义很模糊，因为已经超出了人类的理解，只能从哲学和科幻的角度去分析。

书中有关于奇点是否来临的讨论。前阵子所谓的“尿吓指数”很流行。人们发现，人类的科技水平正在加速发展，短短百年间，人类已经远远超越了历史。所以人们也担心这种加速趋势会导致强人工智能和超级人工智能的快速发展。一旦奇点来临，人类的命运是不可预测的，就像美洲土著无法预测技术先进的欧洲殖民者会带来什么影响一样。书中称，某些技术，比如人工智能，在经过一段时间的加速发展后，会遇到不可逾越的技术瓶颈，比如芯片性能。他的结论是，在一定时期内，都是人的工具，很难突破人工智能的门槛。霍金的担心是机器和人在进化速度上不对等。人工智能可以加速进化，但人类的进化是有限的。此外，还有失业问题。

总的来说，我同意书中的观点，在我有生之年，我可以看到弱人工智能的充分发展，或许还有强人工智能的出现，但超级人工智能还在科幻电影里。我们能看到的更有可能是一个人配合人工智能作为工具的画面。

三、如何应对人工智能时代

人工智能时代的到来是不可回避的客观事实。从乐观的角度来看，人工智能可能是人类社会一个全新的大发展，和三次工业革命一样重要，所以人类生活在一个完全不同的时代，个性和自由可以得到进一步的发展。人们接触效率和生产效率的提高，引起了社会和经济的变化。顺应时代潮流是理性的选择。

我们面临的第一个问题是工作。我们的工作会被取代吗？这本书给出了经验法则:“五秒原则”。如果人们能够在五秒钟内对工作中需要考虑和决定的问题做出相应的决定，那么这项工作就很可能被取代。想想自己的工作就有点担心。但如果涉及到缜密的思考、透彻的推理、复杂的决策，那么这么长时间是很难替代的。一些专家认为，人工智能很容易取代那些有明确评价标准和工作绩效可以客观衡量的人。未来无论什么级别的工作，都将与人工智能合作进行，让高级人才发挥技能，专注于最不可能自动化的工作。这个趋势已经很明显了，各行各业都开始了AI+的进程。既然人工智能在某些领域会做得远远好于人类，那么我们应该考虑的是如何捍卫我们作为人类的价值。做人工智能做不好的事情，比如跨界推理、抽象能力、小样本和无监督学习能力、知道是什么的能力、建立整体系统的能力、常识能力、自我意识、审美、情感等等。

第二个问题是教育。我们需要什么样的教育？该书从社会结构的角度探讨了这个问题。传统的社会结构是金字塔。人工智能时代，金字塔会更加合理高效，底层从事基础工作和重复性工作的人会减少，但金字塔不会倒塌，更有可能在现有基础上自我调整。乐观地说，随着生产力的发展，更多的人从繁重的生计中解脱出来，可以或者必须投入到更加人性化的领域。因此，需要对教育体系进行大的调整，培养更多有知识、有专家、有领导、有艺术的人才，提升人机合作的技能。培养更多人与人之间的思考、创造、交流、情感沟通、依恋、归属与合作、对世界的综合感知与想象等独特能力。只能靠记忆和练习掌握的技能是最没有价值的，几乎肯定可以由机器来完成。死记硬背的应试教育和计算能力是最没用的技能。只有人的个性，才是人工智能时代人类真正的价值。从表现形式上，作者举了两个前沿的例子，一个是密涅瓦大学，一个是清华的《姚班》。他总结说，人工智能时代最核心、最有效的学习方法是:主动挑战极限、从实践中学习、注重启发式教育、交互式在线教育、主动向机器学习、学会人与机器的合作、学会追随兴趣。找一份不容易被机器取代的工作，不管是为了美还是好奇。

该书还阐述了未来的工业发展。自动驾驶是人工智能最大的应用场景，充满想象力。会带动新的业态，新的基础设施建设，新的生活方式，对我来说是福音。作者还详细阐述了自动驾驶技术的发展。他认为中国在发展自动驾驶技术方面有很大优势，可以发挥关键作用。一个是我们在法律和道德上更宽容，一个是基础设施建设是我们的强项。另一个目前被看好的人工智能是智能金融。利用深度挖掘大数据，在量化交易、智能投资、风险防控、安全与客户识别、智能客服精准营销等方面具有优势。翻译，智能医疗。我非常看好智慧医疗。医疗资源紧缺。在人工智能的辅助下，可以提高效率和受众，顶级医生可以腾出精力进行真正具有挑战性的科研。书中还阐述了人工智能创业，从国家战略到企业层面。中国政府有更强的执行力，中国也有优秀的科研人员。此外，还讨论了人工智能时代信息安全的关注点和建议。

第四，对我的启示

生活在这个时代，既幸运又不幸。我们是幸运的，因为我们处在变革时期，有机会看到未来颠覆性的发展。遗憾的是，我们不得不调整自己适应不确定性，我们可能看不到“强人工智能”和“超级人工智能”的充分发展。

乐观地说，未来人们可以全身心投入到自己真正想要的工作中，为自己的热爱而工作，这样人生经历会更加丰富多彩。人工智能会创造更多的财富，大多数人可以更自由地生活，会有更好的新的社会福利体系。由于人工智能的出现，人们再次确认了其独特的价值，即拥有独立的意识，能够理解生的意义和死的内涵。因为生命是有限的，思想和命运可以如此珍贵。书中引用了法国哲学家布莱斯的一句话:“人不过是一根芦苇草，但他知道自己要死了，宇宙也有它的好处，但宇宙对此一无所知，所以我们所有的尊严都在于我们的思想”。不断提升自己，善于利用人类的特长，善于使用机器，将是未来社会各领域人才的本质特征。

同时，人工智能的发展必然会带来严重的问题。从历史上看，生产力的发展，尤其是在初级阶段，会带来很多社会问题，给当时的人们带来痛苦，而新技术不一定能让大多数人受益，可能会造成更大的社会不公。即使从目前来看，信息安全问题和对被接受信息的操纵(如剑桥分析事件)都非常严重，我们面临着更多的危险。

最近看文献，发现有些文章依靠BioNano图谱和Hi-C技术辅助组装。学习生物纳米技术。

BioNano atlas和Hi-C用于将支架锚定在染色体上并协助组装。那么我们来回顾一下这两种技术之前使用的方法。

1，传统锚定方法

染色体锚定有两种传统方法:物理定位和遗传定位。前者主要是通过序列的重叠关系来确定支架在染色体上的位置信息，后者主要是利用减数分裂后姐妹染色单体的重组率来确定支架在染色体上的排序和方向。在实际操作中，传统的锚定方法存在实验难度大、成本高、实验误差大等问题。__

2.基于染色质构象捕获技术的锚定方法。

Hi-C技术的基本原理是:首先用交联剂为活细胞固定染色质，甲醛是最常用的交联剂；然后，固定的染色质被HindIII等限制性酶消化；然后用生物素标记的核苷酸填充粘性末端；稀释环境下进行平端填充反应，促进交联染色质片段之间的连接；然后用超声波打断捕获的_DNA片段，最后用生物素标记的DNA片段在Illumina平台上测序，得到全基因组染色质相互作用矩阵。将获得的DNA序列与参考基因组进行比较。如果一对序列对应不同位置的限制性片段，则认为这两个片段之间存在染色质相互作用，从而可以构建基因组中所有限制性片段之间的相互作用频率矩阵。

Hi-C技术产生的染色质相互作用呈现出随距离增加而衰减的规律，也就是说，染色体内的相互作用强于染色体间的相互作用，同一条染色体上彼此距离较近的相互作用强于距离较远的相互作用。基于这个规律，Hi-C技术可以用来锚定支架，也可以指支架在染色体上的排序和定向。参考Hi-C测序和测序数据特征

3.基于光谱图技术的锚定方法

光学测绘技术最早是由Schwartz等人(1993)发明的。最近BioNanoGenomics公司推出的Irys光学作图系统，真正让光学作图技术商业化(Lametal。,2021).Irys系统使用特殊的限制性内切酶和特殊的荧光标记对高达数百kb的单链DNA分子进行成像，并使用高质量的图像以限制性内切酶图谱的形式显示基因组结构。

光谱的基本原理如下:

在大量的细胞溶液中，DNA分子被随机切割成500kb左右的片段，然后通过微通道DNA片段拉伸并附着在带正电荷的玻璃支架上，再用特定的限制性内切酶在相应的限制性位点切割DNA。切割的DNA分子用荧光染料染色，并在显微镜下拍照(图a-d)。Irys系统特有的超长阅读长度，可以轻松跨越重复序列区和一些含有复杂元件的DNA片段，极大地简化了基因组的组装过程，提高了基因组的组装效率，也解决了拼接缺口的问题。BioNano沿着数百kb的DNA分子(薄片金属)产生小序列结构(例如限制酶识别位点)的物理图。，2021)，不仅可以对支架进行测序和确定方向，还可以对基因组组装的质量进行评价。BioNano最初主要用于小基因组的微生物基因组组装领域，现在已经广泛应用于植物基因组组装领域。

图a-a-dBioNano光学图谱构建示意图

Bionano技术简单来说就是给分子加上荧光标签然后拍照，所以原始的离线数据是TIFF格式的，但是我们得到的一般是AutoDetect/IrysView转换的BNX格式。

Bionano光学图展示了天然DNA分子的真实景观。用SPDNA分离试剂盒获得超长DNA分子，用直接标记染色法(DLS)标记DNA分子。通过纳米微流控芯片将每个DNA分子线性化，进行高分辨率荧光成像，为基因组学的下游应用提供了原始的DNA景观。这种真实的基因组物理图谱为基因组组装提供了染色体规模的框架，可以有效地检测纯合子和杂合子的大片段结构变异。

大白菜参考基因组升级和染色质互作分析，章雷，2018。