ai课程操作答案整理_1768098284_1_在线真题试卷与模拟练习_ai课程操作答案整理_1768098284_1_考试宝

更新时间：试题数量：购买人数：提供作者：

有效期：个月

章节介绍：共有个章节

收藏

我的练习

我的错题
(0道)

我的收藏
(0道)

我的斩题
(0道)

我的笔记
(0道)

专项练习

顺序练习 0 / 0

随机练习 自定义设置练习量

题型乱序 按导入顺序练习

模拟考试 仿真模拟

题型练习 按题型分类练习

易错题 精选高频易错题

学习资料 考试学习相关信息

搜索

题库预览

#读取数据集1分 data = __________ #创建新列‘RiskLevel’，根据住院天数判断风险等级3分 data['RiskLevel'] = np.where(data['DaysInHospital']>7, '高风险患者', '低风险患者') #统计不同风险等级的患者数量2分 risk_counts = data__________ #计算高风险患者占比1分 high_risk_ratio = risk_counts['高风险患者']/__________ #计算低风险患者占比1分 low_risk_ratio = risk_counts['低风险患者']/__________ #根据BMI值划分区间4分 data['BMIRange'] = pd.cut(data['BMI'], bins=bmi_bins, labels=bmi_labels, right=False) #使用左闭右开区间 #计算每个BMI区间中高风险患者的比例2分 bmi_risk_rate = data.groupby('BMIRange')['RiskLevel'].apply(lambda x: (x == '高风险患者').mean()) #统计每个BMI区间的患者数量1分 bmi_patient_count = data__________ #根据年龄值划分区间4分 data['AgeRange'] = pd.cut(data['Age'], bins=age_bins, labels=age_labels, right=False) #使用左闭右开区间 #计算每个年龄区间中高风险患者的比例2分 age_risk_rate = data.groupby('AgeRange')['RiskLevel'].apply(lambda x: (x == '高风险患者').mean()) #统计每个年龄区间的患者数量1分 age_patient_count = data__________

#读取数据集2分 data = pd.read_csv("sensor_data.csv") #对传感器类型进行分组，并计算每个组的数据数量和平均值3分 sensor_stats = data.groupby([______]).agg(['count','mean']) #筛选出温度和湿度数据，然后按位置和传感器类型分组，计算每个组的平均值2分 location_stats = data[data['SensorType'].isin(['Temperature','Humidity'])].groupby(['Location','SensorType']).mean() n°,SensorType"]]["Value"].mean(unstack)

#标记异常值3分 data["is_abnormal"] = __________ #输出异常值数量2分 print("异常值数量:",data['is_abnormal'].sum()) #填补缺失值 data['Value'].fillna(method = 'ffill', inplace=True) data['Value'].fillna(method = 'bfill', inplace=True) #保存清洗后的数据 cleaned_data = data.drop(columns=['is_abnormal']) cleaned_data.to_csv('cleaned_sensor_data.csv', index=False)

#从本地文件中读取数据2分 data = pandas.read_csv("user_behavior_data.csv") #打印数据的前5条记录2分 print(data.head())【缺少答案，请补充】

#处理缺失值（删除）2分 data = __________ #数据类型转换 data_________ = __________(int) # Age 数据类型转换为 int2分 data_________ = __________(float) # PurchaseAmount 数据类型转换为 float2分 data_________ = __________(int) # ReviewScore 数据类型转换为 int2分 #处理异常值2分 data = data[(_________)&(_________)] #数据标准化 data[‘PurchaseAmount’] = (data[‘PurchaseAmount’]-_________)/_________ data[‘ReviewScore’] = (data[‘ReviewScore’]-_________)/_________ #保存清洗后的数据1分 data.to_csv(‘cleaned_user_behavior_data.csv’, index=False)

#统计每个购买类别的用户数2分 purchase_category_counts = __________ #统计不同性别的平均购买金额2分 gender_purchase_amount_mean = __________ #统计不同年龄段的用户数2分 data['AgeGroup'] = pandas.cut(data['Age'],bins=bins,labels=labels,right=False) age_group_counts = __________

#处理缺失值（删除）2分 data = __________ #数据类型转换 data____ = ____(int) # Age 数据类型转换为 int1分 data____ = ____ (float) # Speed 数据类型转换为 float1分 data____ = ____ (float) # TravelDistance 数据类型转换为 float1分 data____ = ____ (float) # TravelTime 数据类型转换为 float1分 #处理异常值2分 data = data[(_________)&(_________)] #保存清洗后的数据1分 data.to_csv(‘cleaned_vehicle_traffic_data.csv’, index=False)

#审核字段合理性1分 unreasonable_data = data[~((data['Age']between(18, 70)) & (data['Speed']between(0, 200)) & (data['TravelDistance']between(1, 1000)) & (data['TravelTime']between(1, 1440)))} #统计每种交通事件的发生次数2分 traffic_event_counts = __________ #统计不同性别的平均车速、行驶距离和行驶时间2分 gender_stats = data.groupby('Gender').agg({'Speed':'mean','TravelDistance':'mean','TravelTime':'mean'}) #统计不同年龄段的驾驶员数5分 data['AgeGroup'] = pd.cut(data['Age'],bins=age_bins,labels=age_labels,right=False) age_group_counts = __________

#加载数据集并显示数据集的前五行1分 data = pd.read_csv('auto-mpg.csv') print(data.head()) #检查缺失值并删除缺失值所在的行2分 print(data.isnull().sum()) data = data.dropna()【缺少答案，请补充】

#将 ‘horsepower’ 列转换为数值类型，并（删除）处理转换中的异常值1分 data['horsepower'] = pd.to_numeric(data['horsepower'],errors='coerce') data = data.dropna(subset=['horsepower']) #对数值型数据进行标准化处理1分 data[numerical_features] = scaler.fit_transform(data[numerical_features]) #选择特征，自变量和目标变量2分 selected_features = [______] y = data['mpg'] X = data[selected_features] #X表示二维矩阵

data = __________ # 将 'horsepower' 列转换为数值类型，并（删除）处理转换中的异常值 data['horsepower'] = __________ data = __________ # 对数据集进行标准化处理 data[numerical_features] = __________ # 选择特征，自变量和目标变量 selected_features = __________ X = __________ y = __________ # 划分数据集为训练集和测试集（训练集占8成） X_train, X_test, y_train, y_test = __________ # 保存清洗和处理后的数据（不存储额外的索引号） cleaned_data.to_csv('2.1.1_cleaned_data.csv', index=False) # 读取一个Excel文件，并将读取到的数据存储在变量data中 data = __________ # 处理数据集中的缺失值 initial_row_count = __________ data = __________ final_row_count = __________ # 删除重复值 data = __________ data[numerical_features] = __________ # 选择特征 selected_features = [_________] X = __________ y = __________ # 创建目标变量 y = __________ # 数据划分（测试集占20%） X_train, X_test, y_train, y_test = __________ # 合并处理后得到的数据，并将其保存（保存中不用额外创建索引） cleaned_data = __________ cleaned_data.to_csv('2.1.2_cleaned_data.csv', index=False) # 加载数据 data = __________ # 显示前五行的数据 print(data.head()) # 使用IQR处理异常值 Q1 = __________ Q3 = __________ IQR = Q3-Q1 data_cleaned = data[(data[numerical_cols] < (Q1 - 1.5 * IQR)) | (data[numerical_cols] > (Q3 + 1.5 * IQR)),].any(axis=1)] # 检查处理重复值 duplicates = __________ # 对数据集进行归一化处理 data_cleaned[numerical_cols] = __________ # 设定目标变量 target_variable = __________ # 定义特征和目标 X = __________ y = __________ # 划分数据集（训练集占80%） X_train, X_test, y_train, y_test = __________

# 保存清洗后的数据到CSV __________ # 加载数据集并指定编码为gbk data = __________ # 查看表格基本信息 print(__________) # 修改列名 data.rename(columns={'病人ID':'患者ID'},inplace=True) # 增加诊断延迟和病程列 data["诊断延迟"] = __________ # 删除不合理的数据 data = data[(_________>=0) & (__________>0) & (__________<120)] data.drop_duplicates(inplace=True) # 对需要归一化的列进行处理 columns_to_normalize = [_________] data[columns_to_normalize] = __________ # 绘制柱状图 __________ # 绘制散点图 __________ # 保存处理后得数据 data.to_csv(output_path, index=False) # 加载数据集 data = __________ # 查看表格基本信息 print(data.info()) # 显示每一列的空缺值数量 print(data.isnull().sum()) # 删除含有缺失值的行 data_cleaned = __________ # 转换'Your age'列的数据类型为整数类型，并处理异常值 data_cleaned.loc[:, 'Your age'] = pd.to_numeric(data_cleaned['Your age'], errors='coerce') data_cleaned.loc[:, 'Your age'].astype(int) # 检查和删除重复值 data_cleaned = __________ # 归一化 data_cleaned['How do you describe your current level of fitness ?'] = label_encoder.fit_transform(data_cleaned['How do you describe your current level of fitness ?']) # 绘制饼图 exercise_frequency_counts.plot.pie(autopct='%1.1f%%', startangle=90, colors=plt.cm.Paired.colors) # 划分数据（测试集占比20%） train_data, test_data = __________ # 保存处理后的数据 cleaned_file_path = '2.1.5_cleaned_data.csv' data_filled.to_csv(cleaned_file_path, index=False) # 加载数据 data = __________ # 显示前五行的数据 print(data.head()) # 分割训练集和测试集（测试集20%） X_train, X_test, y_train, y_test = __________ # 训练Logistic回归模型（最大迭代次数为1000次） model = __________ # 训练Logistic回归模型 model.fit(X_train,y_train) # 保存模型 with open('2.2.1_model.pkl', 'wb') as file: pickle.dump(model, file) # 预测并保存结果 y_pred = __________ accuracy = __________

# 处理数据不平衡 X_resampled, y_resampled = __________ # 重新训练模型 model.fit(X_resampled, y_resampled) # 重新预测 y_pred_resampled = __________ # 分析新的测试结果 accuracy_resampled = __________ # 加载数据集 df = __________ # 显示前五行数据 print(df.head()) # 将 'horsepower' 列的所有值转换为数值类型 df['horsepower'] = __________ df = df.dropna() # 选择相关特征进行建模 X = __________ y = __________ # 将数据集划分为训练集和测试集（测试集占比20%） X_train, X_test, y_train, y_test = __________ # 创建包含标准化和线性回归的管道 pipeline = __________ # 训练模型 pipeline.fit(X_train, y_train) # 保存训练好的模型 with open('2.2.2_model.pkl', 'wb') as model_file: pickle.dump(pipeline, model_file) # 预测并保存结果 y_pred = __________ results_df.to_csv('2.2.2_results.txt', index=False)

# 创建随机森林回归模型实例（创建的决策树的数量为100） rf_model = __________ rf_model = RandomForestRegressor(n_estimators=100, random_state=42) # 训练随机森林回归模型 rf_model.fit(X_train, y_train) # 使用随机森林模型进行预测 y_pred_rf = __________ y_pred_rf = rf_model.predict(X_test) # 保存新的结果 results_rf_df.to_csv('2.2.2_results_rf.txt', index=False) # 加载数据集 df = __________ df = pd.read_csv('fitness analysis.csv') # 显示前五行数据 print(_________) print(df.head(0)) # 选择相关特征进行建模 X = __________ X = pd.get_dummies(X) y = __________ y = df['Your age'].apply(lambda x: int(x.split('(')[0])) # 将年龄段转为数值变量 X_train,X_test,y_train,y_test = __________ X_train,X_test,y_train,y_test = train_test_split(X, y, test_size=0.2,random_state=42) # 创建随机森林回归模型（创建的决策树的数量为100） rf_model = __________ rf_model = RandomForestRegressor(n_estimators=100, random_state=42) # 训练随机森林回归模型 rf_model.fit(X_train, y_train) # 保存训练好的模型 with open('2.2.3_model.pkl','wb') as model_file: pickle.dump(rf_model,model_file) # 进行结果预测 y_pred = __________ y_pred = rf_model.predict(X_test) # 使用测试工具对模型进行测试，并记录测试结果 train_score = __________ test_score = __________ mse = __________ r2 = __________ train_score = rf_model.score(X_train,y_train) #训练集分数 test_score = rf_model.score(X_test,y_test) #测试集分数 mse = mean_squared_error(y_test,y_pred) #均方误差 r2 = r2_score(y_test,y_pred) #决定系数

# 加载数据集 data = __________ data = pd.read_excel('大学生低碳生活行为的影响因素数据集.xlsx') # 显示数据集的前五行 print(_________) print(data.head(0)) # 删除不必要的列并处理分类变量 data_cleaned = __________ data_cleaned = data.drop(columns=['序号','所用时间']) # 仅保留自变量和因变量 X = __________ X = data_cleaned.drop(columns=[target]) y = __________ y = data_cleaned[target] # 将数据集分为训练集和测试集（测试集占20%） X_train,X_test,y_train,y_test = __________ X_train,X_test,y_train,y_test = train_test_split(X, y, test_size=0.2,random_state=42) # 初始化线性回归模型 model = __________ model = LinearRegression() # 训练线性回归模型 model.fit(X_train,y_train) # 保存训练好的模型 joblib.dump(model,model_filename) # 进行预测 y_pred = __________ y_pred = model.predict(X_test) # 将结果保存到文本文件中 results.to_csv(results_filename, index=False, sep='\t')

# 加载数据集 df = __________ df = pd.read_csv('fitness analysis.csv') # 显示前五行数据 print(_________) print(df.head(0)) # 选择相关特征进行建模 X = __________ X = pd.get_dummies(X) y = __________ y = df['daily_steps'] # 将数据集划分为训练集和测试集（测试集占20%） X_train,X_test,y_train,y_test = __________ X_train,X_test,y_train,y_test = train_test_split(X, y, test_size=0.2,random_state=42) # 创建并训练决策树回归模型 model = __________ model = DecisionTreeRegressor(random_state=42) # 训练决策树回归模型 model.fit(X_train,y_train) # 保存训练好的模型 with open('2.2.5_model.pkl','wb') as model_file: pickle.dump(model,model_file) # 进行预测 y_pred = __________ y_pred = model.predict(X_test) # 将结果保存到文本文件中 results.to_csv(results_filename, index=False, sep='\t')

# 模型加载 2分 session = __________ session = ort.InferenceSession('resnet.onnx') # 加载图片 2分 image = __________ image = Image.open('img_test.jpg').convert('RGB') # 预处理图片 2分 processed_image = __________ processed_image = preprocess_image(image) # 进行图片识别 2分 output = __________ output = session.run([output_name], {input_name:processed_image})[0] # 应用softmax函数获取概率 2分 probabilities = __________ probabilities = scipy.special.softmax(output,axis=-1) # 获取最高的5个概率和对应的类别索引 3分 top5_idx = __________ top5_idx = np.argsort(probabilities[0])[-5:][::-1] top5_prob = __________ top5_prob = probabilities[0][top5_idx]

# 加载ONNX模型 2分 ort_session = __________ ort_session = onnxruntime.InferenceSession('mnist.onnx') # 加载图像 2分 image = __________ image = Image.open('img_test.png').convert('L')

# 图像预处理 image = __________ # 转为灰度图 image = __________ # 加载模型输入列表 ort_inputs = {________} # 执行预测 ort_outs = __________ # 获取预测结果 predicted_class = __________

# 定义情感类别与数字标签的映射表 emotion_table = {________} # 加载模型 ort_session = __________ # 加载本地图片并进行预处理 input_data = __________ # 运行模型，进行预测 ort_outs = __________ # 解析模型输出，找到预测概率最高的情感类别 predicted_label = __________ # 根据预测的标签找到对应的情感名称 predicted_emotion = __________

1 2