<div id="7dz3c"><tr id="7dz3c"></tr></div>
<dl id="7dz3c"><ins id="7dz3c"></ins></dl>

<menuitem id="7dz3c"></menuitem>

<sup id="7dz3c"><menu id="7dz3c"></menu></sup>

    <em id="7dz3c"></em>

    我投了份简历,接到了十八个骚扰电话

    宅客频道 宅客频道

    都?#21040;?#19977;银四,最近打算换工作的苏大强(蹭热点式化名)在各大招聘平台挂上了自己的简历。谁知道刚过两天就接到了十八个骚扰电话,其中只有两个来自猎头。

    在接起第十八个贷款推广骚扰电话后,苏大强崩溃了,谁!又是谁TM泄露了我的信息,没钱不贷款还不起还不行吗!

    你有没有想过,数据泄露可能源于那份简历。


    贴条巧达

    ?#20154;?#19968;起新闻。不久前网上有爆料称简历大数据公司?#26412;?#24039;达科技被查封,全?#21271;?#25235;,随后有部分员工被放出。

    3月24日,三言财经也实地走访了巧达位于?#27844;?#26449;办公室,发现大门现已被封条封住,办公室内空无一人。该封条由中钢国际广场保安部张贴,时间为2019年3月14日。

    ?#23601;?#29255;来源:三言财经】

    于是有人好奇,这家公司做了啥突然被封?

    根据公开信息,巧达科技号称拥有?#27844;?#26368;大的简历数据库,其主要数据来源是“乔大招”。乔大招旗下则拥有“爱伙伴”、“简历时光机”等在内10多款招聘相关产品。

    “乔大招”可以通过一款工具汇总多家招聘网站账号信息,企业客户可以统一发布职位、收取简历;其次,该工具可以抓取简历的修改历史,可以查看到对应简历被查阅次数、修改记录等信息;不仅如此,还可以将简历上传至平台,供其他企业、猎头使用。

    爱伙伴是一款提供“员工离职预测”的工具软件,该软件可以检测到员工投递简历、员工简历更新情况以及员工简历被查看次数等信息。企业?#27809;?#36141;买爱伙伴后,即可查看其收集汇总的简历数据,?#26469;?#21028;断公司员工的离职倾向。

    简单说,这个一款给老板打小报告的软件,哪个员工有离职的想法都可能被提前知道。

    截至2015年6月30日,在乔大招的数据库中,以人为计算,收入自然人的简历超过1.6亿人。以版本来计算,简历超过18亿个版本,超过25亿行为轨迹。说不准你精心准备的简历就在其中!

    这些数据都被这家公司用于牟利,甚至涉及违规收集个人信息。封条一帖,巧达凉凉。

    不过,一家“巧达”倒下了,还有其他“巧达”站起来,打着智能招聘SaaS系统的简历公司披着伪善外衣,暗地做着吸血勾当。


    智能招聘SaaS系统

    想要窃取招聘网站的简历数据有什么招数?

    1. 利用公开数据,通过爬虫工具爬取;

    2.?#25103;?#36134;号内部获取数据;

    3.利用网站平台的漏洞进入系统获取数据。

    其中,爬虫技术运用最为广泛,因为不需要网站有任何漏洞,只需要模拟正常?#27809;?#35775;?#20160;?#20316;,就可以抓取。

    瑞数信息CSO马蔚彦告诉宅客频道,?#35805;?#40657;产会通过脚本、自动化框架、?#21482;?#31561;工具去访?#25910;?#32856;网站平台,通过分析招聘网站的接口,这些工具可以自动的进行搜索关键字输入、翻页,对招聘网站内容进行抓取,然后通过脚本程序,将抓取到的原始数据进行格式化处理,转换成可阅读的简历。后期爬虫还可以同过定?#34987;?#21046;,来进行简历数据的定?#34987;?#21462;更新。

    这种爬虫技术与爬各大网站?#22270;?#26426;票本质是一个套路,不同点在于:机票是全公开的,谁都可以看。但部分简历数据需要登录或者付费后查看的,这时候就需要爬虫组织囤积大?#31354;?#21495;进行简历抓取。

    这些账号从何而来?于是打着智能招聘SaaS系统的简历公司出现了,声?#32856;肧aaS产品可以“帮助一个HR管理多个平台?#25103;?#24067;的职位和收到的简历?#20445;?#21482;需要登录一个平台就能管理所有渠道的简历信息。

    购买该产品后,HR手中各大招聘平台的付费账号都被简历公司所掌握。

    (注:目前很多招聘网站的商?#30340;?#24335;都包括付费下载简历进行收费,花几万元可以下载几千份简历,可以查看该招聘网站的无限量个人简历。)

    编辑询问了某做爬虫技术的好友,对方称,通过爬虫技术抓简历?#35805;?#35201;解决四个问题:

    1.登陆的问题,需要购买一些账号;

    2.?#24179;?#30331;陆的验证码;

    3.购买ip代理、切换ip;

    4.控制?#38376;?#34411;的速度,因为登?#24049;螅话?#32593;站后台都会存有日志记录,抓的太快的话,会被封。

    而一套卖给HR的智能招聘SaaS系统就能解决前三个问题,把非法的变成?#25103;?#30340;,?#24179;?#36134;户变成买卖服务。这操作,这脑洞,编辑叹为观止。

    有了账号,之后的操作就更简单了。利用HR的账号?#27844;埽琒aaS方可以去爬取各大招聘平台的简历信息,并做到实时翻新。

    马蔚彦表示这种实时可以分为实时和准实时。

    实时的:有HR来招聘网站上进行简历检索的时候,除了会显示自己本地的数据,还会将搜索请求转发给其他招聘网站的搜索接口进行数据获取,并且可以将爬来的数据进行智能比对,更新简历。

    准实?#20445;好?#20010;简历在招聘简历上都一个唯一的ID,爬虫可以定时的,以ID为参数进行简历数据获取。也就是只要你更改简历,对方就会收到数据,同步更改。

    这时候,你的简历还只是你的吗?


    挂钩黑产

    潘多拉魔盒未打开时一片平静,放在黑盒中的简历数据也是一样。

    你的简历上都有什么信息?#21487;?#26085;、电话、地址、身份证信息、工作经历……这些详细的不能再详细得数据被分销出去,可能卖给大数据分析公司,卖给猎头,卖给贷款公司、卖给诈骗组织,这些都是黑产中的某一?#26041;凇?/span>

    而信息裸奔的你可能接到N个骚扰电话却还不知道问题出自简历。

    即使没有这些打着智能招聘SaaS名义的公司,你的简历就安全吗?

    不一定,邦盛科技产品总监焦林俊向宅客频道透露,某国内top级别的招聘平台曾表示,?#34892;?#22823;商户(付费大企业)利用在招聘平台的账号密码,登?#24049;?#21488;通过爬虫刷新数据,爬取简历。

    之后将爬取下来的简历放进自己的数据库,在合适?#34987;?#23558;这些简历数据出售给需要的机构,相当于二道贩子。

    至于是哪些公司,各位可以自由猜测。


    反爬?#21738;?/span>

    招聘公?#20037;?#23545;各种爬虫技术是否有反爬技术呢?

    “目前也有多种反爬虫的技术,如验证码,IP黑名单,频率限制,IP限制,单一账号可阅读量、需要购买,通过User-Agent控?#39057;?#25163;段都能进行一定限制。但越来越多的高级爬虫,利用大?#30475;?#29702;IP,并且与真实浏览器访问的环境相似度很高,传统的反爬技术在面对高级爬虫时已经基本无能为力。”马蔚彦说道。

    焦林俊也表示,招聘网站确有采取一些反爬虫技术,?#28909;?#21069;?#31169;?#34892;?#29992;埽?#21518;端加入了大数据分析,机器学习等技术。但对大商户爬取数据的行为招聘网站也?#34892;?#22836;疼,迫于营收压力,他们?#25442;?#37319;取直接拦截的措施。而且先通过后台数据分析谁爬取了数据,再针对不同对象采取相应的反?#26469;?#26045;。

    目前来说,爬虫技术?#28304;?#20110;灰色地带,对于利?#38376;?#34411;技术获取公开数据这一行为的正误,在认知上也各有不同。目前更多的还是在道德层面,而非法律,?#28909;紓?#36981;循robots,尽量放慢爬取速度,从而减少对提供数据查询网站的压力,不要造成拒绝服务,不要公开爬虫程序源码,不要分享爬虫数据等等。

    (注:robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点?#20445;?#23427;会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的?#27573;В?#22914;果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。)

    但这些在马蔚彦看来,缺乏法律保障的?#38469;?#21147;非常弱。

    随着涉及个人、企业的数据资源越来越多,提供这些数据的平台、系统也越来越多,非常需要通过建立正确的爬虫观念、提升反爬技术手段、建立合理的爬虫相关法律规定等都多方面的综合努力,才能更好地提供对于恶意爬虫的防御,保护企业和客户数据资源。

    对于终端?#27809;?#26469;说,除了接到手软的骚扰电话,似乎是完全无感知的。

    焦林俊表示,?#27809;?#24212;该避免在?#35805;?#20840;的招聘网站发布简历,遇到打电话称自己是猎头需要提供本人完整信息的说法也不要轻信。而对于招聘网站,应该从业务方面进?#27844;?#33539;,搭建自己反爬虫平台,利用前沿的反爬虫技术,如大数据分析,根据访问行为提取特征,通过设?#38050;?#32441;,人机识别,环境检测等技术识别出人还是机器。这样即可以去掉验证码等降低?#27809;?#20307;验的操作,也避免了?#27809;?#26377;价值的信息被爬取。

    做反爬不能误?#33487;?#24120;?#27809;В?#36825;是反爬虫技术的关键点。爬虫与反爬虫永远在对抗,没有胜负。

    参考来源:三言财经

    蓝字查看更多精彩内容


    探索篇

      暗网【上】|  暗网【下

    薅羊毛 | 黑客武器库威胁猎人

    剁手赚钱 0Day攻击 | 暗黑女主播

    踩雷 |嗑药坐牢重归正途 | 内鬼

    ?#38405;?#26893;入


    真相篇

    拼多多将追回“薅羊毛”订单,包括已充话费和Q币订单

    75条笑死人的知乎神回复,用60行代码就爬完了

    不剁手也吃土?可能是挖矿木马掏空你的钱包

    游戏黑产:我还在空中跳伞,就被人用拳头远程打死

    都8012年了,英国卫生部门居?#25442;?#22312;为?#23433;?#23617;?#20254;?/strong>

    与病毒名称相似,“捏?#22330;?#28216;戏ZEPETO涉嫌窃听?

    扎心!Tumblr推AI鉴黄计划夺老司机“珍爱”

    我报了个税,隐私就?#35805;?#20809;了?

    黑客骗局:Ins网红落难记


    人物篇


    专访:“蹲?#30001;?#22120;”与它背后男人们不得不说的故事

    磨刀人王伟:我前期砸了两个亿做这套方案

    白?#34987;?#30340;赵武摘掉了他的“帽子?#20445;?#19987;访

    数?#33267;?#30431;刘晶晶:四年只做一个产品

    长亭科技陈宇森:我打?#39057;?#22235;个?#23460;?/strong>

    薛锋:我眼中的威胁情报三年之变

    “无锁不开”女黑客——skye

    知道?#20174;?#36213;伟:怼死“空气币”

    李均:我眼中的黑客精神

    风宁:自由?#36137;?#32773;

    更多精?#25910;?#22312;整理中……

    ---

    “?#19981;?#23601;赶紧关注我们”

    宅客『Letshome』

    雷锋网旗下?#21040;?#25253;道公众号。

    专注先锋科技领域,?#24425;?#40657;客背后的故事。

    长按下图二维码并识别关注


    推荐
    安徽快三开奖结果快

    <div id="7dz3c"><tr id="7dz3c"></tr></div>
    <dl id="7dz3c"><ins id="7dz3c"></ins></dl>

    <menuitem id="7dz3c"></menuitem>

    <sup id="7dz3c"><menu id="7dz3c"></menu></sup>

      <em id="7dz3c"></em>

      <div id="7dz3c"><tr id="7dz3c"></tr></div>
      <dl id="7dz3c"><ins id="7dz3c"></ins></dl>

      <menuitem id="7dz3c"></menuitem>

      <sup id="7dz3c"><menu id="7dz3c"></menu></sup>

        <em id="7dz3c"></em>