更新时间: 试题数量: 购买人数: 提供作者:

有效期: 个月

章节介绍: 共有个章节

收藏
搜索
题库预览
金融机构信用评估系统中的业务数据审核流程设计 考核时间:30min 场地设备要求: 人工智能训练师主机:CPU(intel i5及以上)、内存(不少于16GB)、操作系统(windows10)、支持深度学习训练; 工作任务: 某金融机构计划引入智能信用评估系统,通过分析客户的历史交易数据和信用记录,使用机器学习算法预测客户的信用风险等级,从而辅助贷款审批和风险控制。为了确保数据的准确性和可靠性,该机构需要设计并实现一套全面的业务数据审核流程,确保数据在进入信用评估系统之前经过严格的审核和清洗。 我们提供一个客户信用数据集(credit_data.csv),包含以下字段: ● CustomerID: 客户ID ● Name: 客户姓名 ● Age: 年龄 ● Income: 收入 ● LoanAmount: 贷款金额 ● LoanTerm: 贷款期限(月) ● CreditScore: 信用评分 ● Default: 是否违约(0: 否,1: 是) ● TransactionHistory: 历史交易记录(JSON格式) 你作为人工智能训练师,根据提供的credit_data.csv数据集和Python代码框架(1.1.3.ipynb),完成以下数据的审核和处理任务,确保数据的准确性和可靠性。请按照以下要求完成任务,确保结果准确并保存相应的截图。 (1)数据完整性审核: 通过运行Python代码(1.1.3.ipynb)检查数据集中的每个字段是否存在缺失值和重复值。将上述审核结果截图以JPG的格式保存,命名为“1.1.3-1”。 (2)数据合理性审核: 通过运行Python代码(1.1.3.ipynb)审核以下字段的合理性: ●年龄:应在18到70岁之间。 ●收入:应大于2000。 ●贷款金额:应小于收入的5倍。 ●信用评分:应在300到850之间。 对不合理的数据进行标记,并将审核结果截图以JPG的格式保存,命名为“1.1.3-2”。 (3)通过运行Python代码(1.1.3.ipynb)对数据进行清洗,处理异常值。具体要求如下: ● 将不合理的数据进行标记,并对异常值所在行进行删除; ● 清洗后的数据保存为新文件cleaned_credit_data.csv。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 技能要求: (1)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程; (2)能结合人工智能技术要求和业务特征,设计整套业务数据审核流程 质量指标: (1)完整性指标:数据集中无缺失值和重复记录。 (2)合理性指标:所有数据点符合业务规则,无异常值存在。 (3)清洗效果指标:清洗后的数据集完整、合理,且适于建模分析。 (缺图)
人工智能训练师(三级)操作技能考核 试题单 准考证号: 试题代码:1.1.4 试题名称:电商平台用户行为分析系统的数据采集与处理流程设计 考核时间:30min 1.场地设备要求 人工智能训练师主机:CPU(intel i5及以上)、内存(不少于16GB)、操作系统(windows10)、支持深度学习训练; 2.工作任务 某电商平台希望通过用户行为数据分析,了解用户购物习惯、购买倾向等,从而优化产品推荐系统,提高用户满意度和销售额。作为数据分析师,您需要设计一套全面的业务数据采集与处理流程,确保数据在进入用户行为分析系统之前经过严格的采集、清洗和预处理。 我们提供一个用户行为数据集(user_behavior_data.csv),包含以下字段: ● UserID: 用户ID ● UserName: 用户名 ● Age: 年龄 ● Gender: 性别(Male/Female) ● Location: 位置 ● LastLogin: 上次登录时间 ● PurchaseAmount: 购买金额 ● PurchaseCategory: 购买类别(例如,电子产品、服装、食品等) ● ReviewScore: 用户评价评分(1-5) ● LoginFrequency: 登录频率(每日、每周、每月) 你作为人工智能训练师,根据提供的user_behavior_data.csv数据集和Python代码框架(1.1.4.ipynb),完成以下数据的采集与处理任务,确保数据的准确性和可靠性。请按照以下要求完成任务,确保结果准确并保存相应的截图。 (1)数据采集: 通过运行Python代码(1.1.4.ipynb),从本地文件user_behavior_data.csv中读取数据,并将数据加载到DataFrame中。打印前5条数据。 (2)数据清洗与预处理: 通过运行Python代码(1.1.4.ipynb)对数据进行清洗和预处理,具体要求如下: ● 处理缺失值:对缺失值进行填充或删除。 ● 数据类型转换:确保每个字段的数据类型正确。 ● 处理异常值:删除不合理的年龄、购买金额和评价评分。 ● 数据标准化:对购买金额和评价评分进行标准化处理。 清洗后的数据保存为新文件cleaned_user_behavior_data.csv。 (3)数据统计: 通过运行Python代码(1.1.4.ipynb),完成以下数据统计任务: ● 统计每个购买类别的用户数。 ● 统计不同性别的平均购买金额。 ● 统计不同年龄段的用户数(18-25岁、26-35岁、36-45岁、46-55岁、56-65岁、65岁以上)。 将统计结果分别截图以JPG的格式保存,分别命名为“1.1.4-1”、“1.1.4-2”、“1.1.4-3”。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 3.技能要求 (1)能结合人工智能技术要求和业务特征,设计整套业务数据采集流程 (2)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程 4.质量指标 (1)完整性指标:数据集中无缺失值和重复记录。 (2)合理性指标:所有数据点符合业务规则,无异常值存在。 (3)清洗效果指标:清洗后的数据集完整、合理,且适于建模分析。【缺少答案,请补充】
人工智能训练师(三级)操作技能考核 试题评分表 准考证号: 试题代码: 试题名称:电商平台用户行为分析系统的数据采集与处理流程设计 考核时间:30min 测量评分表 | 细则编号 | 配分 | 评分细则描述 | 规定或标称值 | 结果或实际值 | 得分 | | ---- | ---- | ---- | ---- | ---- | ---- | | M1 | 2 | 从本地文件中读取数据的代码正确得2分 | 根据数据 | | | | M2 | 2 | 打印数据的前5条记录的代码正确得2分 | 根据数据 | | | | M3 | 2 | 处理缺失值的代码正确得2分; | 根据数据 | | | | M4 | 2 | Age数据类型转换的代码正确得2分; | 根据数据 | | | | M5 | 2 | PurchaseAmount数据类型转换的代码正确得2分; | 根据数据 | | | | M6 | 2 | ReviewScore数据类型转换的代码正确得2分; | 根据数据 | | | | M7 | 2 | 处理异常值的代码正确得2分; | 根据数据 | | | | M8 | 2 | PurchaseAmount数据标准化的代码正确得2分; | 根据数据 | | | | M9 | 2 | ReviewScore数据标准化的代码正确得2分; | 根据数据 | | | | M10 | 1 | 保存清洗后的数据的代码正确得1分; | 根据数据 | | | | M11 | 2 | 统计每个购买类别的用户数的代码正确得2分; | 根据数据 | | | | M12 | 2 | 统计不同性别的平均购买金额的代码正确得2分; | 根据数据 | | | | M13 | 2 | 统计不同年龄段的用户数的代码正确得2分; | 根据数据 | | | | 合计配分 | 25 | 合计得分 | | | | (缺图)
人工智能训练师(三级)操作技能考核 试题单 准考证号: 试题代码: 试题名称:智能交通系统的数据采集、处理和审核流程设计 考核时间:30min 1.场地设备要求 人工智能训练师主机:CPU(intel i5及以上)、内存(不少于16GB)、操作系统(windows10)、支持深度学习训练; 2.工作任务 某智能交通系统希望通过车辆的行驶数据,利用人工智能技术进行交通流量预测和拥堵预警。你作为人工智能训练师,需要设计一套全面的业务数据采集、处理和审核流程,确保数据在进入交通流量分析系统之前经过严格的采集、清洗、审核和预处理。这里提供一个车辆行驶数据集(vehicle_traffic_data.csv),包含以下字段: ● VehicleID: 车辆ID ● DriverName: 驾驶员姓名 ● Age: 年龄 ● Gender: 性别(Male/Female) ● Speed: 车速(km/h) ● TravelDistance: 行驶距离(km) ● TravelTime: 行驶时间(min) ● TrafficEvent: 交通事件(Normal, Accident, Traffic Jam, Breakdown) 你作为人工智能训练师,根据提供的vehicle_traffic_data.csv数据集和Python代码框架(1.1.5.ipynb),完成以下数据的采集、处理和审核任务,确保数据的准确性和可靠性。请按照以下要求完成任务,确保结果准确并保存相应的截图。 (1)数据采集: 通过运行Python代码(1.1.5.ipynb),从本地文件vehicle_traffic_data.csv中读取数据,并将数据加载到DataFrame中。显示前5行数据截图以JPG的格式保存,命名为“1.1.5-1”。 (2)数据清洗与预处理: 通过运行Python代码(1.1.5.ipynb)对数据进行清洗和预处理,具体要求如下: ● 处理缺失值:对缺失值进行删除。 ● 数据类型转换:确保每个字段的数据类型正确。 ● 处理异常值:删除不合理的年龄、车速、行驶距离和行驶时间。 清洗后的数据保存为新文件cleaned_vehicle_traffic_data.csv。 (3)数据合理性审核: 通过运行Python代码审核以下字段的合理性: ● 年龄:应在18到70岁之间。 ● 车速:应在0到200 km/h之间。 ● 行驶距离:应在1到1000 km之间。 ● 行驶时间:应在1到1440分钟(24小时)之间。 对不合理的数据进行标记,并将审核结果截图以JPG的格式保存,命名为“1.1.5-2”。 (4)数据统计: 通过运行Python代码(1.1.5.ipynb),完成以下数据统计任务: ● 统计每种交通事件的发生次数。 ● 统计不同性别的平均车速、行驶距离和行驶时间。 ● 统计不同年龄段的驾驶员数(18-25岁、26-35岁、36-45岁、46-55岁、56-65岁、65岁以上)。 将统计结果分别截图以JPG的格式保存,分别命名为“1.1.5-3”、“1.1.5-4”、“1.1.5-5”。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 3.技能要求 (1)能结合人工智能技术要求和业务特征,设计整套业务数据采集流程; (2)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程; (缺图)【缺少答案,请补充】