首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    实例 | 教你用Python写一个电信客户流失预测模型

    [i] = df[i].replace({'No internet service' : 'No'}) # 替换值SeniorCitizen df["SeniorCitizen"] = df["SeniorCitizen..."].replace({1: "Yes", 0: "No"}) # 替换值TotalCharges df['TotalCharges'] = df['TotalCharges'].replace('...= ['Churn'] cat_cols = df.nunique()[df.nunique() < 10].index.tolist() num_cols = [i for i in df.columns...目标变量Churn分布 经过初步清洗之后的数据集大小为7032条记录,其中流失客户为1869条,占比26.6%,未流失客户占比73.4%。...07 建模前处理 在python中,为满足建模需要,一般需要对数据做以下处理: 对于二分类变量,编码为0和1; 对于多分类变量,进行one_hot编码; 对于数值型变量,部分模型如KNN、神经网络、Logistic

    2.8K52

    技术创作特训营 | 新版内容评分逻辑说明

    各位开发者伙伴:为进一步优化技术创作特训营的评选机制,更好地鼓励优质、深度的技术内容产出,本期特训营正式推出新版内容综合评分逻辑,旨在让每一份有价值的技术创作都能得到公正评价与认可。...'].astype(str).str.replace('%','',regex=False) df['完读率'] = df['完读率'].astype(str).str.replace('%','',...regex=False) num_cols = ['文章字数','代码行数','平均阅读进度','完读率','平均有效访问时长'] for col in num_cols: df[col...(count_df, on='作者ID', how='left') norm_cols = num_cols + ['发布篇数'] for col in norm_cols: max_val...若内容核心逻辑、技术实践、个人经验为原创,仅用 AI 辅助优化表达,不会影响获奖;若被判定为 AI 生成的低价值内容,将取消获奖资格。

    1.1K81
    领券