建立回归模型预测数据分析岗位薪资(上)

建立回归模型预测数据分析岗位薪资(上)

一、分析目标

通过建立因变量与自变量之间的多元线性回归模型以便根据自身条件预测自己能拿到的薪资

数据集:链接: pan.baidu.com/s/16rQ3JG

提取码:pkz7

二、数据预处理

(1) 构造因变量:平均薪资变量

(2) 按照 disctrict 向量将地区重新划分为北上广深和非北上广深两个水平

(3) 将公司规模转变为因子型变量,便于画图

(4) 将学历转化为因子型变量,便于画图

(5) 匹配各个公司要求的统计软件

建立 software 数据框,用于存放各个公司的软件匹配结果

对每个描述观测进行分词,并存储在 software 里面,循环次数为总观测数,总观测数可

通过 length(job$描述)获取

设置各个软件的判别条件,以 R 为例,R.indentify 表示 r 或 R 是否在 fenci 这个变量里

判断各个描述变量里面是否有某软件要求,以 R 为例,第 j 个描述变量,若 R.identify

为 TRUE 时,software 的第 j 行的 R 变量为 1,反之为 0;

将平均薪资和 software 这两个数据框合并

(6) 加入需要的变量

(7) 公司类别中非营利机构与事业单位两类观测过少,予以删除

(8) 重赋列名

(9) 保存数据集

天下网标王果洛seo报价松岗阿里店铺托管多少钱玉溪网站建设设计价格枣庄设计网站日照至尊标王推荐揭阳优化报价徐州关键词按天收费烟台网站制作设计哪家好甘孜网页设计哪家好大芬英文网站建设公司宿州建网站公司唐山阿里店铺运营霍邱如何制作网站推荐泸州模板制作鄂州网络推广公司龙华网站推广系统公司潜江百度爱采购哪家好济源SEO按效果付费推荐乌海网站定制价格贵阳网站搭建哪家好林芝企业网站改版安顺网站改版价格南山百度网站优化排名推荐潜江关键词排名公司廊坊seo网站优化推荐朔州网站建设报价漯河网站改版公司民治建网站报价拉萨网站建设设计哪家好陇南设计网站公司香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化