insilicomedicine公司怎么样,rl 人工智能
各位网友好,小编关注的话题,就是关于rl人工智能的问题,为大家整理了2个问题rl人工智能的解答内容来自网络整理。
insilicomedicine公司怎么样
Insilico Medicine是一家新型人工智能公司,在全球6个国家和地区分设有办公室。公司致力于加速药物发现与开发中三个领域的发展:疾病靶点发现、生成全新分子结构(生成化学)及合成生物数据的生成(生成生物学),以及临床试验结果预测。
Insilico Medicine于2015年率先利用生成对抗网络(GANs)和强化学习(RL)技术,生成具有特定性质的药物分子结构。除了与大型制药企业合作开发药物外,Insilico Medicine也在内部开展了众多药物发现项目,希望在各疾病领域取得突破。
关于强化学习有哪些应用
首先,众所周知,强化相较于传统视觉的深度学习技术,一般会消耗更多的计算资源。而更为特别的是,在广泛的强化学习应用场景中,往往最优方案都包含对在线(online)学习能力的要求。所以迫于计算成本的限制,大部分涉及到现实世界工业的实际工程应用中都无法采用最优的在线学习方案,而退而采用离线的方案(不涉及现实世界工业的在线应用例子就是AlphaGo,离线的具体例子下面会详细展开)。
先通过强化学习将智能体的行为网络训练完成,再将得到的网络进行优化(提高计算效率),最后将该判决网络复制进工程设备进行量产,这就是离线方式不同于在线(边训练边判决)的地方。这么做的好处有两点:一自不用说,节约计算资源;二就是能更好的把控设备的可靠性。
于是,对应于这些特性,能落地的应用也就明了了。具体来说有:自动农业采摘机器人(从识别到完成采摘行为)、智能客服助理(在线的,在如jd、ali这类大型电商有应用)、扫地机器人(不同于早期廉价的仅依靠碰撞检测转向逻辑的非RL版本)、小型仓库及商场的出入库机器人、大型仓库及码头的自动吊装、物流自动分拣机械手(不同于流水线机械手,其关键在于攻克了对物流件多样性的自适应问题)。
总的来说,强化学习技术相较于基于深度学习的机器视觉、自然语言处理和传统自动控制技术而言,在工业生产中的应用仍存在性能及可靠性方面的问题。特别的,深度学习技术在工业界目前最为广泛且能实现高可靠性的应用是刑侦与安防(安检识别、人脸识别、追逃、案件分析辅助、测谎等)。而作为深度学习技术的相关技术,强化学习技术在大多数控制领域仍无法取代传统自动控制技术(无论是从成本上,还是可靠性上)。更多时候,强化学习是在扮演一个辅助系统决策的角色,而完全采用强化学习解决方案的基本只有少数Robotics领域的应用(比如扫地机器人)。
强化学习属于机器学习一种,它的本质是解决连续决策的问题。其中包含四个部分,分别是代理人、环境状态、动作、奖励。因此,强化学习虽然有不同的算法和应用,但是万变不离其宗,都必须确定出来这个四个部分。
最让人熟知的莫过于下围棋的AlphaGo了。那么在这种场景中,代理人就是下围棋的机器人,状态是整个棋盘的棋子布局,动作则是下棋的位置,奖励为是否最终赢得了比赛。
1)商品推荐系统和搜索排序中的应用,
其目的就要让搜索引擎能够对不同特点的用户作出针对性的排序,并以此带动搜索引导的成交提升,是一个极具挑战性的问题。在这个设定中,可以把搜索引擎看作代理人、把用户看做环境,则商品的搜索问题可以被视为典型的顺序决策问题。而代理人每一次排序策略的选择可以看成一次试错,把用户的反馈和点击成交等作为从环境获得的奖赏。在这种反复不断地试错过程中,代理人将逐步学习到最优的排序策略,最大化累计奖赏。
2)机器人控制应用
机器人控制同样也是一个连续时间决策问题。需要在不同的时间节点,以及不同的状态下做出相应的决策,即控制策略。现在已经将强化学习应用于用机械臂抓取特定物体。其中动作是具有多个自由度的机械臂运动方向和大小,状态则是当前机械臂所处的位置,而奖励则设定为成功抓取到指定的物体。
3)自然语言处理和智能对话方面的应用
自然语言的对话由于其本身就附带有时序信息,因此可以利用强化学习来解决智能问答场景中的同顾客交流为问题。目前越来越多地厂商推出了使用自然语言对话接口与计算机进行交互的铲平。比如亚马逊的 Alexa、苹果的 Siri、小米的小爱同学 和微软的 Cortana(小娜)。这些产品已经在为数百万用户提供服务了。
到此,大家对rl人工智能的解答时否满意,希望rl人工智能的2解答对大家有用,如内容不符合请联系小编修改。
本文系作者个人观点,不代表本站立场,转载请注明出处!