北京韶光 2024 年 5 月 3 日凌晨, Oracle 公司宣告正在为其数据库产品供应最新的长期支持版本 Oracle Database 23ai。
值得一提的是,这款数据库的曾用名是 Database 23c,后来由于数据库中添加了一些 AI 功能而变更为现在的名称。

Oracle Database 23ai 正式宣告!年近 50 岁的数据库巨擘正迈入 AI 时代_数据_庞杂 计算机

除了 AI 功能外,Oracle Database 23ai 的云版本还供应了 300 多项新功能中,包括 Java Script 存储规程、优先事务、数据用例域、Schema 权限、布尔数据类型、开拓者角色、JSON Schema、实时 SQL 方案管理、微做事支持改进、XML 与 JSON 搜索索引增强等。

Oracle 公司在***稿中表示,“在过去四年间,Oracle 数据库开拓部门一贯致力于为 Oracle 数据库打造下一个长期支持版本,且重点关注 AI 与开拓者生产力需求。
考虑到新版本数据库对付 AI 的高度关注,我们决定将名称从 Oracle Database 23c 变动为 Oracle Database 23ai,以此反响本次发布的重点与当前技能市场的整体背景”。

Oracle Database 23ai 专注于三大关键领域:数据与 AI、数据与开拓以及数据与关键任务。

数据与 AI

在这一部分,Oracle Database 23ai 的核心目标有两个:第一,是让运用开拓者能够更轻松地将 AI 功能添加至数据驱动的运用程序当中;第二,是将天生式 AI 功能纳入我们的产品,以便 Oracle 数据库的所有用户(从数据剖析师到运用程序开拓者及 DBA)都能享受到事情效率提升。

而效率提升的详细实现,源自利用 AI 简化 Oracle 数据库的数据管理流程、供应 AI 算法以从数据中创造新见地、促进数据库查询的自然措辞交互,以及利用户能够存储 AI 天生的向量以快速实现对各工具的相似性搜索。

增强新一代 AI 模型

过去两年,人们已经感想熏染到了 AI 大措辞模型(LLM)带来的影响,ChatGPT、谷歌 Gemini、Cohere 以及 Llama 等产品便是例证。
虽然大模型对人们处理日常事务的办法产生了深远影响,但这些引擎也同样面临着一大寻衅——它们只能在其创建的特定时间窗口之内回答问题。
也便是说,它们并不能有效利用组织之内保存的数据、背景以及更多细节。
为了让各种大模型发挥出更加全面的浸染,须要结合数据库中的已有数据,帮助并增强大模型对付干系问题的解答能力。

在 Oracle Database 23ai 当中,Oracle 研发团队引入了 AI 向量搜索。
这是一项强大的新技能,许可大家利用新一代 AI 模型来天生并存储向量。
这些向量(也被称为嵌入)是文档、图像、***、声音等的多维表示。
通过将这些工具编码为向量,可以利用数学打算来查找它们之间的相似性。

Oracle Database 23ai 办理方案的真正强大之处,在于它可以将这些相似性搜索与利用大略 SQL 的业务数据搜索结合起来。
也便是说,任何对 SQL 拥有基本理解的人都可以编写出相似性与其他搜索条件相结合的强大语句。
这类查询为大模型带来了额外的背景信息,增强了他们的知识也让他们的回答更加准确,并与客户或组织的问题内容息息相关。
为了启用此功能,研发职员还添加了新的数据类型、新的向量索引以及 SQL 措辞扩展,以便降落 Oracle Database 23ai 中高等剖析功能、查询向量以及现有业务数据的操作门槛。

那么,这些功能是如何实现的?

据 Oracle 先容,为了实现大措辞模型的潜在上风,他们首先须要加深对付数据集以及个中工具的理解。
对这些工具进行编码的模型,每每是由弘大且繁芜的无数代码片段构建而成。
因此,组织每每须要将处理事情移交给第三方做事机构。
而这种与第三方分享潜在敏感信息的行为,也自然会带来相应风险。

数据安全编码

为了确保工具的安全编码,Oracle Database 23ai 许可用户通过 ONNX 标准支持将自己的可信 AI 模型直接加载至数据库当中。
如此一来,Oracle Database 23ai 就能在工具插入数据库时对其进行编码。
这不仅让针对工具的近实时安全推理成为可能,同时也避免了从数据库中提取数据并将其移交给第三方做事商的风险环节。

以自然顺畅的办法提出问题

虽然 SQL 是一种非常强大的措辞,但其上手难度也其实不低。
为了让更多用户能够面向 Oracle 数据库提出各种繁芜问题,我们正动手与 Cohere 及 Llama 等大措辞模型相集成,以实现提问流程的自然措辞支持能力。
现在用户可以大略提出问题,比如“显示最近 4 个季度以来,最受年轻一代消费者欢迎的产品销量。
”Oracle Database 23ai 将与大模型共享表内元数据以回答用户提问。
大模型能够理解“年轻一代”的含义,并将其转换为数据范围以作为 SQL 查询中的过滤条件,将指令返回至数据库。
当然,除了查询数据库内的信息以外,Oracle Database 23ai 大概可用户就各个方面的内容提出讯问。

自 Oracle Database 9iR2 在 20 多年前发布以来,这款数据库一贯内置有机器学习(ML)算法,以帮助用户快速查找表内数据的模式、趋势并预测客户行为。
这些机器学习算法许可大家轻松实现各种功能,且无需经历繁芜的 ETL 操作来提取数据并写回结果。
而在将数据插入或加载至 Oracle 数据库时,这些机器学习模型还可用于分类、聚类及预测,从而供应客户推举、敲诈检测等一系列切实业务上风。
自该版本发布以来,研发团队陆续改进了 Oracle 数据库并添加了更多新的机器学习算法及功能,建立起业界最繁芜、功能最强大的数据挖掘平台之一。

适用于所有 Oracle Database 版本

AI 向量搜索作为 Oracle Database 23ai 中的一部分,将在企业版、标准版 2、Database Free 以及所有 Oracle Database 云做事中供应(不额外收费)。

AI 向量搜索在发布之前就引起了广泛关注,许多客户及互助伙伴都热衷于考试测验并供应关于 AI 向量搜索等最新功能的反馈。
Miracle Finland Oy 公司 CEO Heli Helskyaho 表示:“AI 向量搜索通过将 AI 引入数据的办法,改变了我们对付业务的核阅角度:例如,我们可以利用自然措辞来查询文档内容,以找到客户所提出问题的答案。
这使得为客户供应做事的过程变得更快,做事质量也有所提高。
这种将天生式 AI 之力与自有数据相结合的利用办法,必将带来巨大的变革。

数据与开拓

Oracle Database 23ai 专注于肃清与数据库交相互干的繁芜性,借此简化运用程序开拓体验。
肃清运用程序开拓流程中的繁芜性,这意味着利用该款数据库产品时,用户能够把更多精力投入到构建更优雅运用程序当中,而不再身陷充斥着各类技能细节的泥潭。
此外,降落繁芜性还有助于缩短开拓周期,帮助用户更好地适应市场需求变化多端、开拓节奏难以把控确当前数字环境。

JSON 还是关系——一个困难的选择

Oracle 23ai 引入了多项关键技能以降落开拓者面临的繁芜性,而个中最具创新意义和功能实效的,当数 JSON-关系二元性的引入。
这项技能许可用户在单一运用当中充分利用关系的强大功能与 JSON 开拓方法的便利性。
JSON 供应一种优雅的数据建模方法,个中回答查询所须要的全部干系数据都将包含在单一工具之内,而无需跨表实行繁芜的联接。
关系方法供应灵巧、存储高效且同等的数据模型,易于利用 SQL 等措辞进行查询。
从历史角度来看,用户每每须要在运用程序生命周期之初就被迫选择一种数据库建模方法,而随着后续业务需求的变革,早期阶段做出的决策很有可能产生深远影响、乃至阻碍业务的顺畅运行。
JSON-关系二元性的优点在于,用户能够同时享受这两种方法的上风,而无需利用繁芜且笨重的工具关系映射框架(ORM)。

通过在关系表之上创建大略的 JSON Duality 视图,用户可以构建起用文档来查询并更新根本数据集的运用程序。
这不仅避免了文档建模中的一个基本问题——数据重复,乃至能够将数据库级的并发掌握繁芜性隐蔽起来,由 Oracle Database 23ai 代表用户管理文档级可串行性。
大家可以连续利用大略的 HTTP PUT、POST 及 GET 操作,或者直接针对 Oracle Database 利用特定措辞的 API,例如 Oracle SODA API 乃至 MongoDB API。
有了 JSON Duality Views,“鱼与熊掌不可兼得”将彻底成为历史。

让 SQL 更加易用

SQL 仍旧是当今运用程序开拓者群体中最盛行的开拓措辞之一。
这种涵盖从最大略、到最繁芜的业务数据查询能力,也使得 SQL 成为数据管理领域的绝对基石。
在可预见的未来,SQL 的江湖地位大概率仍不可动摇。
当然,个中也仍有可以改进的地方。
在 Oracle Database 23ai 中,研发职员听取了大量增强要求,并研究了哪些能够切实简化、或者以更加引人瞩目的办法实现数据库交互。
他们此番针对 SQL 做出的改进包括添加“布尔”与“向量”两种新的数据类型,添加了“数据用例域”以许可用户丰富表定义中所利用数据类型的含义,肃清了大略 SQL 语句对付“from Dual”的硬性哀求以提高可读性、从而更轻松地聚合“interval”数据类型,同时引入表值布局函数以轻松在 insert select 或 merge 语句中指定多个行。

为繁芜关系建立属性图模型

图数据库为现实场景中的各种繁芜关系供应全新的建模视角。
然而截至目前,开拓职员仍旧很难办理专有措辞带来的问题,不得不将数据发送至专门用于管理这些关系的数据库,因此阻碍了这项打破性技能得到广泛收受接管。
好在数据库行业考试测验以协作办法推动图数据库技能的大众化,并终极建立起干系标准。
这些标准使得开拓职员能够熟习并发挥 SQL 的功能广泛性上风,从而建立起更易于访问的环境。
Oracle Database 23ai 便是采取这一新标准建立的首创性商用数据库。
通过这些进步,估量图数据库在企业生态系统中的集成将迎来大幅增长。

与 JSON 二元视图一样,用户可以通过属性图视图来表达希望如何利用现有关系表,或者如何利用 JSON 集群中已经保存的数据。
通过大略视图,用户可以充足数据以对数据内包含的潜在繁芜关系进行建模。
新的 SQL 扩展也简化了编写强大查询的流程,方便用户更深入地理解那些以往标准 SQL 所难以描述的信息。
研发职员还添加了一组新的繁芜图形算法(最短路径、分类、连接等),这些算法将在 GA 版本发布后尽快推出。

Property Graph 属性图将在 Oracle Database 23ai 的所有版本中向用户开放。

数据与关键任务

Oracle Database 长期以来,一贯在为环球各种最主要的运用处景供应支持,其功能和利用范围非常广泛,且善于保护关键系统免遭意外停机。
个中一个范例用例便是 Oracle Real Applications Clusters(RAC),这是一项支持全活、共享磁盘数据库的前沿技能,适宜匹配关键任务场景。
Oracle Active DataGuard 与 Oracle GoldenGate 在构建同构与异构数据复制架构方面也能供应独树一帜的灵巧性上风。

让分片更好、更快、更大略

对付企业希望在更远间隔上分发数据的用例(无论是出于用户数据必须存储在客户所处国家/地区的硬性监管哀求,还是为了降落环球分布式运用程序的干系访问延迟),研发职员还引入了来自 Oracle Database 12 的数据库分片机制。
分片是指将数据集分布在多个 Oracle 数据库当中,但统一作为单个逻辑数据集进行管理。
这种分片架构许可通过添加及删除分片来扩展或紧缩数据库,并许可 Oracle 对数据集自动进行重新均衡。
Oracle 能够在线完成这项操作,而且由于分片机制直接嵌入数据库之内,因此对业务的正常运行影响很小。

在 Oracle Database 23ai 中,全局分布式数据库技能引入了对 Raft 复制功能的支持。
这是一种基于共识的协议,有助于跨所有分片自动配置复制。
利用 Raft,复制数据将在所有分片中作为“复制单元”的副本形式进行保存。
一旦发生分片故障或者重新配置,Oracle Database 23ai 会自动对数据实行重新均衡。
新的 Raft 协议还支持亚秒级故障转移,能够有力保障业务连续性。

Oracle 23ai 还为高可用性产品带来了一系列全面改进,例如新的“本地滚动数据库掩护”,通过在吸收补丁的同一节点上建立另一实例,以简化集群中滚动补丁的影响。
Oracle 还引入了新的 Data Guard Per Pluggable Database(PDB)支持,许可在两个容器数据库(CDB)之间供应可插拔的数据库级灾害保护功能,且每个 CDB 都运行活动事情负载。
我们还改进了 Oracle Clusterware 中的 PDB 集成与管理。

让数据缓存更大略

在运用程序层缓存数据能带来诸多好处,包括提高运用程序的相应速率并减少数据库负载,这是由于查询会被转移至与代码间隔更近的缓存当中。
但为了实现这些好处,开拓职员每每面临着诸多寻衅,个中最大的问题之一便是确保缓存与后端数据库中保存数据的同等性,否则可能引发供应过期/潜在缺点数据的风险。
以往,开拓职员会被迫编写繁芜的代码来管理这些场景,且常常须要乞助于“存活韶光”之类的设计模式,个中数据会定期在缓存内刷新并重新加载。
各类繁芜寻衅的存在,意味着缓存的掩护将相称困难且昂贵。
在某些情形下,掩护本钱每每要比设计本钱更高、也更令用户头痛。

在 Oracle Database 23c 中,开拓职员希望通过名为“True Cache”的新功能办理 Oracle Database 中的缓请安题。
True Cache 是在主数据库之前运行的非磁盘 Oracle 实例,该实例利用 Active Data Guard 技能确保其随着主数据库实例中的数据变更而自动更新。
这种新型缓存技能最主要的功能之一,便是在大略配置与最低程度代码变动需求的条件下即可发挥浸染。

让 SQL 实行更安全

组织面临的一大寻衅,便是恶意攻击者不断考试测验盗取数据并毁坏其日常运营。
在 Oracle Database 23ai 中,为了防止实行未经授权的 SQL(包括 SQL 注入攻击以及未经授权职员的实行操作),研发职员引入了 SQL 防火墙。
SQL 防火墙许可用户利用许可实行的 SQL 来演习数据库。
之后,SQL 的“获准列表”会记录未经授权的 SQL 或者其实行情形。
用户还能添加其他条件,以明确列出 IP 范围或授权调用程序中的例外情形。
SQL 防火墙之以是如此强大,是由于它属于 Oracle Database 的组成部分,因此对付 SQL 实行造成的额外开销非常有限。
SQL 防火墙的设置和演习都非常大略,可以通过 GUI 或者对存储过程的大略调用轻松完成。

事实上,Oracle Database 23ai 的发布之以是会引发如此大的关注,最紧张的缘故原由是由于其引入了 Oracle AI 向量检索功能。
此功能许可客户根据观点内容(而不是特定的单词、像素或数据值)轻松搜索文档、图像和其他非构造化数据。

通过安全地结合对非构造化数据和私有业务数据的搜索,Oracle Database 23ai 能够在不移动和复制数据的情形下就可以轻松完成该任务,这样的操作在数据安全领域尤为主要。

与须要将数据移动到算法所在位置的传统 AI 算法不同,Oracle Database 23ai 将 AI 算法带到数据所在位置。
这使得人工智能能够在 Oracle 数据库中实时运行,从而提高人工智能运用程序的有效性、效率和安全性。

原文链接:新增300多项功能,Oracle Database 23ai正式发布!
年近50岁的数据库巨子正迈入AI时期_数据湖仓_核子可乐_InfoQ精选文章