单选题 统计模型在数据挖掘中的核心作用是什么?
A、直接替代数据挖掘算法完成分类任务
B、通过概率分布刻画数据行为以识别噪声和缺失值
C、仅用于可视化数据分布而不参与建模过程
D、强制要求所有数据必须符合正态分布
单选题 当异常指标作为因变量进行分析时,以下哪项是其核心价值?
A、消除变量共线性影响
B、发现数据分布拐点
C、揭示影响因素与异常的关联关系
D、生成标准化异常评估指数
单选题 后向传播算法属于哪种类型的学习方法?
A、符号主义学习
B、连接主义学习
C、行为主义学习
D、贝叶斯学习
单选题 为何Logistic回归系数需要进行反向变换才能解释业务关系?
A、模型假设违反独立同分布条件
B、回归系数采用最小绝对偏差法计算
C、因变量经历了对数变换导致解释复杂化
D、最大似然估计不满足无偏性要求
单选题 广义线性模型允许因变量采用哪些测量类型?
A、仅连续型变量
B、仅二分类变量
C、仅计数型变量
D、包含连续、二分类、有序分类、无序分类、计数等多种类型
单选题 关于完全随机缺失(MCAR)的描述,以下哪项是正确的?
A、MCAR的缺失比例通常超过50%
B、MCAR的缺失机制与变量自身或其他变量均无关
C、MCAR必须使用多重插补法进行填补
D、MCAR的备择假设是数据完全随机缺失
单选题 时间序列分析中,以下哪项要素描述的是'非固定周期的交替波动'?
A、趋势
B、季节变动
C、循环波动
D、不规则波动
单选题 关于大数据和数据科学概念混淆的原因,以下哪项最能体现核心问题?
A、高科技企业垄断了数据科学的应用场景
B、基础术语缺乏严格定义和共识
C、统计学方法在科技界的简单移植
D、机器学习算法的快速迭代发展