多选题 某电商平台使用Hadoop Spark处理用户浏览日志,需完成以下分析任务:①实时统计当前在线用户数;②离线计算过去7天每个用户的平均浏览时长;③实时推荐用户可能感兴趣的商品(基于最近浏览记录)。以下哪些Spark组件和编程模型适合这些任务?
相关试题
单选题 在神经网络训练中,优化器的选择直接影响模型的收敛速度和最终效果。此时换用以下哪种优化器,通常能更快收敛且更稳定?
单选题 在不平衡数据集场景中,此时更应关注以下哪种指标,以确保模型能有效识别阳性样本?
单选题 数据预处理是企业 AI 项目的基础环节,以下哪种数据预处理操作不能解决上述问题?
单选题 在自注意力机制中,"query""key""value"三个组件的核心作用是?
单选题 在企业 AI 项目中,经常会遇到需要根据历史数据预测用户行为的场景。例如某电商平台想要通过用户过去 3 个月的浏览记录、加购记录、购买频率等带标签的数据训练模型,以判断新用户是否会购买某款商品。这种需要依赖标注数据进行训练的学习方式属于以下哪种机器学习类型?
单选题 以下关于“预训练阶段”的核心目标,描述正确的是?
单选题 卷积神经网络(CNN)是计算机视觉任务的核心模型,在企业中广泛应用于商品图像分类、人脸识别、瑕疵检测等场景。以下关于 CNN 卷积层的主要作用,描述正确的是?
单选题 某 AI 数据工程师在训练一个“用户信用评分模型”时,发现模型在训练集上的准确率达到 98%,但在测试集上的准确率仅为 65%,这种“模型在训练数据上表现好、在新数据上表现差”的现象被称为过拟合。以下哪种方法不能有效防止过拟合?