選擇在正確的時間正確的二進制指標
本页面介绍了连接、Oracle 和 MySQL 错误,以及排查这些错误的步骤。
- 确保源数据库已启动且可以访问。
- 从数据流或连接配置文件页面导航到来源连接配置文件。
- 验证连接配置文件连接信息是否正确。
- 验证用户名和密码是否匹配。
- 验证数据库上是否存在该用户名且是否具有所需权限。
- 保存您在连接配置文件页面上所做的任何更改。
单个客户端访问名称 (SCAN) 是一项 Oracle Real Application Clusters (Oracle RAC) 功能,可为客户端提供单一名称来访问集群中正在运行的 Oracle 数据库。
SCAN 侦听器会强制重定向到本地侦听器。不过,Datastream 使用点对点连接。这会导致 Datastream 从数据库获取重定向时会失去与 Oracle 数据库的连接。
如需解决此问题,请在为源 Oracle 数据库创建连接配置文件时,在主机名或 IP 字段中输入本地侦听器或节点 IP 地址(而不是 SCAN IP 地址)。
-
确保您已满足准备工作中的所有前提条件。
在创建专用连接配置后,请验证 VPC 网络对等互连页面的导出的路由标签页中是否显示了包含数据库的内部 IP 地址的路由。
为此,请转到 VPC 网络对等互连页面,然后搜索已添加的对等互连(名称为 peering-[UUID] )。您可以在导出的路由标签页中找到路由。如果此路由不存在,请手动添加它。
您为要创建的连接配置文件选择了公共 IP 许可名单或转发 SSH 隧道网络连接方法。但是,Datastream 的禁止使用公共连接方法组织政策已启用。因此,您无法为连接配置文件选择公共连接方法。
- 转到 Google Cloud Console 中的组织政策页面。
- 选择 Datastream - 禁止使用公共连接方法组织政策。
在强制执行部分中,选择关闭。
Oracle 错误
如果源数据库上的补充日志记录配置不正确,则提取正在进行的变更数据捕获 (CDC) 数据时可能会出错。验证补充日志记录是否已正确配置。具体来说,确认正在从来源流式传输到目标位置的数据库表已启用补充日志记录功能。数据流会自动恢复。
日志文件可能已被删除。Oracle 会尽快完全清除日志文件,除非您指定了最短轮换周期来保留它们。在 選擇在正確的時間正確的二進制指標 Oracle 服务器中,设置日志文件的保留时间。例如,使用 CONFIGURE RETENTION POLICY TO RECOVERY WINDOW OF 4 DAYS; 将日志文件保留至少 4 天。
对于 RDS 部署,请使用 exec rdsadmin.rdsadmin_util.set_configuration('archivelog retention hours',96);
MySQL 错误
如果源数据库的二进制日志配置不正确,则连续 MySQL 数据流可能会发生此错误。如需排查此错误,请执行以下操作:
- 验证二进制日志是否配置正确。
- 确认 MySQL 数据库的二进制日志格式已设置为 ROW 。
- 重启数据流。
- 确保源数据库遵循矩阵。
- 使用更新后的源数据库重新创建数据流。
Except as otherwise noted, the content of this page is licensed under the 選擇在正確的時間正確的二進制指標 Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its 選擇在正確的時間正確的二進制指標 affiliates.
二进制模型洞察
许多二进制分类算法的实际输出是预测分数。该分数指示给定观察属于正类的系统确定性 (实际目标值为 1)。在亚马逊 ML 中的二进制分类模型输出一个介于 0 和 1 之间的分数。作为此分数的使用者,为了决定观察应分类为 選擇在正確的時間正確的二進制指標 1 还是 0,需要选取分类阈值或者选取截断值,并与分数进行对比,以此来解释分数。当目标等于 1 时,将预测其分数高于截断值的任何观察;当目标等于 0 时,将预测其分数低于截断值的观察。
在亚马逊 ML 中,默认的分数截断值为 0.5。您可以选择更新此截断值以满足您的业务需求。您可以在控制台中使用可视化内容来了解截断值的选择将对您的应用程序造成怎样的影响。
衡量 ML 模型准确度
Amazon ML 为二进制分类模型提供行业标准的准确度指标,称为 (受试者操作特征) 曲线下面积 (AUC)。AUC 衡量模型为正面示例预测出相比负面示例更高分数的能力。由于它独立于分数截断值,因此您可以从 AUC 指标感受到模型的预测准确度,无需选取阈值。
AUC 指标返回从 0 到 1 的数值。接近 1 的 AUC 值指示高度准确的 ML 模型。接近 0.5 的值指示 ML 模型比随便猜测好不了多少。值接近 0 的情况很少见,这通常表示数据有问题。基本上,接近 0 的 AUC 表示 ML 模型已学习了正确的模式,但使用它们来预测会得到与实际颠倒的结果 (将“0”预测为“1”或者将“1”预测为“0”)。有关 AUC 的更多信息,请转到 Wikipedia 上的 受试者操作特征 页面。
二进制模型的基线 AUC 指标为 0.5。这是随机预测 1 或 0 答案的假想 ML 模型的值。您的二进制 選擇在正確的時間正確的二進制指標 ML 模型要想有价值,表现得应该比此值要好才行。
使用性能可视化
要探究 ML 模型的准确度,您可以查看评估亚马逊 ML 控制台上的页面。此页显示两个直方图:a) 实际正例分数的直方图 (目标为 1) 以及 b) 实际负例分数的直方图 (目标为 0)。
具有良好预测准确度的 ML 模型对于实际的 1 将预测较高的分数,对实际的 0 将预测较低的分数。完美的模型将在 x 轴两端具有两个直方图,实际正例全部得到高分,实际负例全部得到低分。但是,ML 模型会出错,一般的图表会显示两个直方图在某些分数重叠。性能极差的模型会无法区分正类和负类,这两个类的直方图重叠最多。
正确预测
真阳性 (TP):亚马逊 ML 预测的值为 1,真正的值为 1。
真阴性 (TN):亚马逊 ML 预测的值为 0,真正的值为 0。
错误预测
假阳性 (FP):亚马逊 ML 预测的值为 1,但真正的值为 0。
假阴性 (FN)選擇在正確的時間正確的二進制指標 選擇在正確的時間正確的二進制指標 :亚马逊 ML 预测的值为 0,但真正的值为 1。
TP、TN、FP 選擇在正確的時間正確的二進制指標 和 FN 的数量取决于所选分数阈值,对这些类型中的任意一种进行优化都意味着需要对其他类型作出让步。TP 数高通常会导致 FP 数高和 TN 数低。
调整分数截断值
ML 模型的工作方式是生成数字预测分数,然后应用截断值将这些分数转换为二进制 0/1 标签。通过更改分数截断值,您可以在模型出错时调整其行为。在存储库的评估在 選擇在正確的時間正確的二進制指標 Amazon ML 控制台的页面上,您可以查看不同分数截断值的影响,并可以保存希望用于模型的分数截断值。
优化指标和满意度指标
最后再举一个例子,假设你正在设计一个硬件设备,该设备可以根据用户设置的特殊 “唤醒词” 来唤醒系统,类似于 Amazon Echo 的监听词为 “Alexa”,苹果(Apple) Siri 選擇在正確的時間正確的二進制指標 選擇在正確的時間正確的二進制指標 的监听词为 “Hey Siri”,安卓(Android) 的监听词为 “Okay Google”,以及百度(Baidu)应用的监听词 “Hello Baidu.” 我们关心的指标是假正例率(false positive rate,又译作假阳率,误诊率)—— 用户没有说出唤醒词,系统却被唤醒了,以及假反例率(false negative rate,又译作假阴率,漏诊率)——用户说出了唤醒词,系统却没能正确被唤醒。这个系统的一个较为合理的优化对象是尝试去最小化假反例率(优化指标),减少用户说出唤醒词而系统却没能正确唤醒的发生率,同时设置约束为每 24 小时不超过一次误报(满意度指标)。
CN107451562A - 一种基于混沌二进制引力搜索算法的波段选择方法 - Google Patents
Publication number CN107451562A CN107451562A CN201710643734.5A CN201710643734A CN107451562A CN 107451562 A CN107451562 A CN 107451562A CN 201710643734 A CN201710643734 A CN 201710643734A CN 107451562 A CN107451562 A CN 107451562A Authority CN China Prior art keywords mrow particle msub msubsup band Prior art date 2017-07-31 Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.) Granted Application number CN201710643734.5A Other languages English ( en ) Other versions CN107451562B ( zh Inventor 叶志伟 杨娟 王明威 张旭 陈宏伟 刘伟 王春枝 苏军 Current Assignee (The listed assignees may be inaccurate. Google has not performed 選擇在正確的時間正確的二進制指標 a legal analysis and makes no representation or warranty as to the accuracy of the list.) Hubei University of Technology Original Assignee Hubei University of Technology Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes 選擇在正確的時間正確的二進制指標 no representation as to the accuracy 選擇在正確的時間正確的二進制指標 of the date listed.) 2017-07-31 Filing date 2017-07-31 Publication date 2017-12-08 2017-07-31 Application filed by Hubei University of Technology filed Critical Hubei University of Technology 2017-07-31 Priority 選擇在正確的時間正確的二進制指標 to CN201710643734.5A priority Critical patent/CN107451562B/zh 2017-12-08 Publication of CN107451562A publication 選擇在正確的時間正確的二進制指標 Critical patent/CN107451562A/zh 2020-04-24 Application granted granted Critical 2020-04-24 Publication of CN107451562B publication Critical patent/CN107451562B/zh Status Active legal-status Critical Current 2037-07-31 Anticipated expiration legal-status Critical