Search
View: 390|Reply: 0
Print Prev. thread Next thread

这种类型的桌面虚拟化就会起作用

[ Promote this link! ]

2

!threads!

0

Friends

14

Money

member

Rank: 1

Jump to specified page
1#
Post time 2022-8-29 16:27:55 |Show the author posts only |Descending
这个百分比误差在估计测试集中的误差方面非常有效,不需要进一步的交叉验证。 54. 为什么与其他集成算法相比,boosting 是一种更稳定的算法? Boosting 专注于在以前的迭代中发现的错误,直到它们变得过时。而在 bagging 中没有纠正循环。这就是为什么与其他集成算法相比,boosting 是一种更稳定的算法。 55. 如何处理数据中的异常值? 离群值是数据集中的一个观测值,它与数据集中的其他观测值相距甚远。

我们可以使用箱线图、散点图、Z-Score、IQR 分数等工具和函数发现异常值,然后根据我们得到的可视化处理它们。为了处理异常值,我们可以限制某个阈值,使用转换来减少数据的偏度,并在异常值或错误时删除异常值。 处理数据中的异常值 56. 列出流行的交叉验证技术。 主要有六种交叉验证技术。它们如下: K折 分层k折 留一个 自举 随机 阿尔及利亚 WhatsApp 号码 搜索简历 网格搜索简历 57. 是否可以在不使用交叉验证技术的情况下测试提高模型准确性的概率?如果是,请解释。 是的,可以在没有交叉验证技术的情况下测试提高模型准确性的概率。

我们可以通过运行 ML 模型进行n次迭代来记录准确性。绘制所有准确度并删除 5% 的低概率值。测量左 [低] 截断和右 [高] 截断。剩下 95% 的置信度,我们可以说该模型可以变低或变高 [如截止点中所述]。 58. 说出一种流行的降维算法。 流行的降维算法是主成分分析和因子分析。 主成分分析从更大的一组测量变量中创建一个或多个指数变量。因子分析是潜在变量测量的模型。这个潜在变量不能用单个变量来衡量,并且可以通过它在一组y变量中引起的关系来观察。 59. 我们如何将没有目标变量的数据集用于监督学习算法?

You have to log in before you can reply Login | 立即注册

Heyshell

2024-11-6 03:05 GMT+8 , Processed in 0.036971 second(s), 20 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

To Top