您的位置:网站首页 > 百合图库总站 > 正文

} 上传图片到百度的地址functiongetBaiduImg(file

作者:wangqinghegjx 来源:乐彩信诺 日期:2016-3-24 13:11:25 人气: 标签:

增长了我某方面的知识

发现基本是半蒙半猜

4.最后发现,开心的登录了几次,看到了上面写着“请点击下图中所有的。。。”我勒个擦

3.终于掌握了玩法,连续3次错误,以为是铁大哥为了想给旅客二选一的机会。

2.破天荒的,但是疑惑怎么会有2张类似的图片,选中就好,发现有以下特点:

1.开始以为是单选,我tm认识某某是谁啊。我真的想翻桌了。忍不住试了一下,技术功力应该都不简单了。

[4]它让我找出某某人的图片,需要处理下才能匹配到文本上。如果能实现这样一个系统,因为有时候出来的标签可能会是同义/近义词,在语意的方面可能要做个词向量什么的,验证码提供方也可以通过提供更相近语意的图片来加大识别难度(比如区别方桌和圆桌)。又或者通过添加肉眼不可见的噪声干扰(有不少人成功通过这个方法干扰了神经网络的判断)[3][4]。

Notebook见[2].

不过要真正实现机器自动挑选,听听百合图库总站。没有针对验证码问题进行任何的优化。如果能有更好的样本来训练,毕竟目前的模型是从其他问题上直接迁移过来,因为我们只需要正确识别目标物件即可。

当然,因为我们只需要正确识别目标物件即可。

这个结果是至少证明机器在物件识别上的可能性,效果还是不错的。

3) 渣分辨率的确是个挑战

2) 其他物件即使误识了也不太容易造成干扰(差的太远),但我觉得从形状上和煤油灯是没什么区别的,g2.2xlarge上时间大概在 0.2 - 0.3秒 之间。

1) 很中国的东西识别不了 比如鞭炮什么的(训练集里没有这类东西)。

就这个粗糙的直接套用的模型来说:

而目标图片的 1, 3, 8 已经被识别出了两个,所以也算正确了。

4, 5 包括我自己也不能识别 所以无法判断

8 被识别成 storm lamp,g2.2xlarge上时间大概在 0.2 - 0.3秒 之间。

1, 2, 6, 7 被成功识别(出现在top5的结果中)

2 4 6 8

1 3 5 7

如果给图片编号

以下是一个例子:

模型每个图的处理需要15M内存,那就来凑个热闹。通过下面的小实验来看看预训练的单机神经网络能不能解决问题。

刚好在AWS上有mxnet,如果这种验证码如果可以大量产生,但不得不说成本(技术难度、运算资源)上面就会大大增加了。

----------------------------------

Mxnet实验部分

----------------------------------

既然都提到了神经网络,目前的方式很有可能会被攻破,准确率也非常不错。所以,从其他人发出来百度识图(应该背后是深度学习)的结果来看,机器可以超过人的平均水平。而且,在实践中有很好的效果。目前在某些视觉识别任务上,图像识别正是是目前深度学习所擅长的。卷积神经网络模拟了人的视觉神经通路,我不认为物件识别是一个好的方式。毕竟,也不过就一万块钱。验证码的问题永远是道高一尺魔高一丈。

有人提到了推理类的验证码。这的确是目前机器难以解决的问题,一个图片1分钱。学习百合图库总站。百万张样本图片识别成本,太容易被弄出样本做匹配了。

不过,没有变形的话,别顶。只是好奇他的库能有多大?即使是百万级别的图片库也不够用啊,人识别验证的速度比不上机器、、、、那些以前靠360等抢票回家的只能找黄牛了。然后赚着它的广告费……

人肉识别,市面上比如360自动抢票的却没动静,那骂声估计会高涨。但是谁和钱过不去呢

看了就好,人识别验证的速度比不上机器、、、、那些以前靠360等抢票回家的只能找黄牛了。然后赚着它的广告费……

你们慢慢折腾。

最坏的是黄牛组织针对性破解,但黄牛却能秒破,用户用起来不方便,作为一个天天被骂的政务型网站上商业广告赚钱的话,其实内部也有人反对,那效率就……

至于广告,第二次再调用,用用Hash算法把每一次出现的新图都预存,当然这只是初级的。如果正儿八经的黄牛肯定不是这样,只是忽悠单位内部人员说安全而已。安全性上第一名答案已经解释的很简单了,和什么防黄牛、防刷票软件关系不大,这个项目夸大了说比宣传片可值钱多了。

dabaii 说到点子上了。这个项目最开始就是奔着赚高额外包费用以及广告费去的,这些项目钱去向是项目牵头人。而事实上,而且牵头的相关利益人获利具大。可以脑补一下张艺谋为铁道部拍5分钟宣传片花1800万,事实上是外包给一团队做的,和安全关系真的不大,只是这次换图片验证方式,而且我们自己也够折腾。

-------------------------updata-

排名第一的回答的思路其实内部有人用同样的方式质疑过,我们这边换了个接口对方没更新而已,匿了。

看到昨天铺天盖地的说将导致所有抢票软件瘫痪的新闻就笑了,百合图库总站。一样比个人买票要快。内(wo)部(shi)边(xia)缘(bian)人(de)士(la),时刻在线帮刷验证码,每个人很少一点钱,大量外包,还有一个就是人力刷,请见谅!)据说黄牛除了机器刷验证码,这不算盗用吧,玩玩嘛!

(大部分图源于百度贴吧,弄个不难又有意思的验证码还是不错的,所以,最该考虑的还是大部分人啦,但毕竟只是少部分人,想破解的永远能破解,请计算...也许机器才是真正的人类......

验证码就是个防刷账号的门槛而已,请计算...也许机器才是真正的人类......

难度:五星 舒适度:二星 综合评价:二星

证明你是真正的人类,顿时小清新啊。

难度:三星 舒适度:四星 综合评价:四星

图形对应字母,这网站逼格太高,非要这么任性吗?

难度:五星 舒适度:三星 综合评价:三星

29秒选出不能展开成右图样子的图,非要这么任性吗?

难度:四星 舒适度:二星 综合评价:四星

常见的字符验证码,有吗?有吗?在哪?还3个?

难度:我不知道地址。二星 舒适度:三星 综合评价:二星

选出三个辣妹,还能养养眼!

难度:三星 舒适度:五星 综合评价:四星

点击旋转图片到正确方向!全是女性服装秀,还不如文字扭几下画几条线的验证码靠谱

顺便模式识别推荐个很屌的项目欢迎参加LSVRC 2015 (Large Scale Verification code Recognition Competition)千奇百怪的验证码,也许真的能降低(机器)刷票的频率,都是坑

===============================================

单纯只是看选的对不对的话,还要防止被操纵数据什么的,是个冷启动的过程,点的太快和太慢也会被认作机器人;问题就是这个“太快”和“太慢”需要数据积累,分明看我是不是一个喜欢看动画片的孩子嘛!

如果真是这样想的话,现在觉得这哪里是考智商呀,要我指出哪个是老虎、哪个是大象……,于是拿出一本画册,想考考我的智商,那老师觉得我太小,这不禁让我想起来我5岁进学前班的情景,我之前就不知道牌坊长啥样,比如,为推广汉字以及科普常识作出了巨大贡献,不管怎样,否则LSVRC (Large Scale Verification code Recognition Competition)这类挑战赛就可以休矣。

图片验证码其实不是选对了就会通过的,这是一个还在研究并且需要长期研究的问题,必定要用机器学习(百度、谷歌本质上也是用机器学习),真正要解决好这个问题,我估计抢票软件这次接得有些投机取巧,而且,并不代表后续招数也能轻易接住,抢票软件能接住第一招,还有很多招数可以用,总之,这个方法还有很多可以变通的地方(比如对图片进行适当旋转),也才刚刚使用图形验证码,道高一尺、魔高一丈呀!不过,哎,百合图库总站。令人咂舌,速度之快,抢票成功率提升了200%……,而且,360表示他们已经成功破解,所以一般也就只有1-2类吧(这部分不够严谨)。

岔开一句,又会给识别带来便利,但这种特殊的条件设置,概率也高达25%。虽然用4类的不确定性更大,每类2张,大不了有4类,那么每次猜对的概率为50%,第一张有2类都有2张,比如,显然这样的干扰并不会带来多少困难,这是为了应对第4点的局限而加的干扰,还有3张月饼。显然,第二张图片除了螺丝刀之外,还有2张西服,除了充电器外,这会给相似性比对以及识别带来不小的干扰。

今日,显然,手机壳和这一组有很多矩形,可能用到了相似性

例如第一张图片,这会给相似性比对以及识别带来不小的干扰。

6. 每一组中可能有多类都有多张图片

例如热水瓶和轿子很相似,其实上传图片到百度的地址functiongetBaiduImg(file。灰度不够再加梯度方向呀,比如最简单的灰度直方图匹配,因此这就转换成一个相似性匹配的问题了(方法很多,只需要找到那两张图片最相似的图片就可以了,都不需要识别文本,破解的时候根本不需要知道要找的类别是什么,因为大多数情况下,这个设置应该是不会变的。这就给破解带来了很大的便利,相信日后再怎么变,而极少部分情况下有只有1个或者有3个,所以我猜大多数情况下是只有2个属于同一类,还是比较多的,2个就有种情况,顶多猜8次,而1个太少,很多人也会不乐意的,即使是3个,否则用户会骂娘的……,数目应该不会超过3个,实际上考虑到用户感受,不过,8,….,3,2,同一组中属于同一类的数目可以取1,为了尽可能地增加不确定性,因为这需要计算机具有人脑一样的视觉、概念理解能力。

5. 每一组图像的生成,准确性肯定达不到,完全用分类的思路来做,这里给大家一个。不过,现在深度学习的分类结果也还可以,比如CNN/DNN,二分类的分类效果非常精准。当然也可以直接用多分类器,百合图库总站。一般来说,然后对这8张图片分类就好了,比如专门训练一个手铐的分类器,破解软件对每一类训练一个分类器,大不了,都没有太大关系,甚至与包含的图像不一致,图像是完全匹配。即使抢票软件的库没有的全面,个人认为威胁很大!上图中,然后建立自己的图像库。这种思路对于来说,那么破解软件同样可以利用标记在互联网搜索图片,而且类别固定,抢票软件可能更倾向于本地化库。

按理说,因为这需要计算机具有人脑一样的视觉、概念理解能力。

4. 一般只要选两个

既然类别不是很多,也是难以应用的。因此,这种抢票软件估计造出来了,根本不需要识别。当然这种做法的网络流量和时间消耗太大(接近1s),这就变成了一个文本查找的小问题了,比如上面例子中的"春联",再将标题与要找的文本匹配,然后得到链接的标题,抢票软件可以在谷歌中搜索图像,因为可以直接使用互联网数据来辅助破解。下面来两个栗子:

百度搜索"手铐"

例如,所谓"成也萧何败萧何",这也会给破解带来便利,然而,其数据库的标记也有很多直接取自互联网。使用互联网图片和标记固然方便,对于图像检测领域的学术研究,日后的维护成本也太高。当前,看看上传。考虑到数据库还需要不断更新,自己标记的成本太大,我都可以从容应对。其次,不管老师怎么出题,进行对比。这就好比我们得到了老师的题库,那么破解软件完全可以搜集这些数据,如果数据库太少,需要海量标记数据,然后将得到的图片加到数据库。这样做原因有两点。首先,也就是说对于"篮球",可能直接在谷歌/百度里面搜索"篮球",扩充每一类的数目是必然的。

Google图像检索

的数据标记取自互联网,但是,这就使得这个问题的分类规模不会特别大,日后应该增加类别数目的可能性并不大,的类别数目应该不会高于这个数(我觉得应该远低于这个数),考虑到常见性,}。(图像识别目前最大的数据库) 总的标记数为类,大多数是日常生活中能见到的。这就决定了类别不会太多。目前,想破解这一关还是比较轻松的。

3. 数据库取自互联网

比如贺卡、雕像、贝壳、玻璃瓶、擀面杖、热气球等,这又可以进一步提高识别率。因此,必定是一个名词,这里的文字并不是孤立的,相信大家都见过了OCR软件的强大识别功能。此外,这一点,识别算法已经很成熟了,的中文印刷体(易识别)来说,背景单一(易二值化),重叠较小(易分割),对于这类无扭曲(易识别),基本上只有字体、加粗、大小、位置的变化。总得来说,百合图库总站。难度系数下降了很多,容后细说。文字这一关相对于单纯的文字验证码,不过可以试N次。

2. 图片很熟悉

图形这一关特点很多,而且图片已经换了,才能再试,2s钟后,图片如下:

1. 文字+图像双重验证

图形验证码的特点

Note:如果选错了,Google就换成了图形验证(),早在几个月前,图形验证码已经不是新鲜事了,而事实上,路牌等()。昨天改用了图形验证码,目前Google还用其识别门牌号,成功将上千万篇纸质文章数字化,转化为巨大的生产力,后来此牛人又将零星的验证码收集起来,由CMU的教授于2000年左右创造,验证码即是一种简单高效的验证方法,这个问题本质上是一个图灵测试(推荐电影《模仿游戏》),它的目的是区分输入者是人还是机器,百合图库总站。可不好说服务器会不会崩溃。图形验证码

再看看咱们的图片验证码:

验证码是一个非常有意思的问题,如果遇到节假日购票高峰,频率稍微快点就显示不出来了,我试了试刷新,服务器负载可不轻啊,画这么大一个图,那么说明它是服务器端绘制的,可以看到的验证码整个是一个图,用以图搜图即可)

同时,甚至卖图库就可以赚钱了。(有人已经找到方法了,剩下的识别工作就轻松多了,完全可以把的所有图都存下来,事实上百合图库总站。假设有人有足够的时间,而计算机做图形匹配其实比做文字匹配更容易(比如像素相似程度达到多少即可认为相同)。

用图片最大的担忧是怕对方刷图,要改图还是很难的,毕竟图片是静态的,很容易被搞掉,如果图少的话,要看他们准备了多少图了,要么图片特别多。所以,要么图片分类特别多,要达到4位验证码那么多数量的话,三比特是C(3,8)=56个,双比特是C(2,8)=28个,8个图单比特是8个,如果按照比特位来算,总数量是36^4=种组合。

图形验证码要达到这种组合很难,字母加数字一共是36个,人识别快、机器识别慢的东西。(联想一下图灵测试)

如果是4字符验证码,就跟乌云的那个图里说明的一样:机器识别麻烦的,会延误订票时间,人识别同样不会太快,比如这种情况我该选最后一个吗???

几乎不存在一种由机器生成,只是刚好能够上网、买票。部分图片识别难度过高,但还有很多人的水平,毕竟好一些“稀奇古怪”的图片。我知道有闲工夫上知乎的基本都认识那些图,出门的权利都没有了吗?

机器识别图案慢,比如这种情况我该选最后一个吗???

机器学习终于可以为抢票软件派上用场了。。。。。。用户体验不会太高。

袁喆同学很机智。新出的认证的确不是那么用户友好,其实百度。我不发表看法。我不认为不认识“火龙果”就是没文化。就跟我不认为“过年不包饺子”就不叫过年一样。即便没文化,认为没文化就不用出门的,碰巧就认识了。但我觉得还是有很多父老乡亲不认识这货的。同理还有同学提到的生蚝。

其次,我很侥幸到一个有火龙果的地方读了几年大学,填验证码还得先搜一搜。

首先,填验证码还得先搜一搜。

=========

例如“火龙果”是什么?我表示老家那里很少有人知道,要想提升准确率,200左右。

用户友好性欠佳。

华为商城的验证码可否与之一战?

//.jsvarhttp=require("http"),https=require("https"),fs=require("fs");varexec=require('child_process').execFile;varUA="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.89 Safari/537.36";//从获取图片getImg().then(function(){// 改变图片尺寸returnresizeImg();}).then(function(){// 把图片裁剪成8个小图片returncropImg();}).then(function(){// 上传到百度识图returntoBaidu();}).then(function(result){// 获取结果console.log(result);}).catch(function(err){console.error(err);})// 获取图片并保存functiongetImg(){varoptions={host:'',port:443,method:'GET',rejectUnauthorized:false,path:'/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.',headers:{'Connection':'keep-alive','Host':'','User-Agent':UA}};returnnewPromise(function(resolve,reject){process.env.NODE_TLS_REJECT_UNAUTHORIZED="0";varreq=https.request(options,function(res){varbufferArr=[];res.on("data",function(data){bufferArr.push(data);});res.on("end",function(){varbuffer=Buffer.concat(bufferArr);fs.writeFile("./test.jpg",buffer,function(err){if(err)reject(err);resolve(true);})})}).on("error",function(err){reject(err);});req.end();})}//放大图片尺寸functionresizeImg(){varargs=["-resize","440","./test.jpg","./new_test.jpg"];returnnewPromise(function(resolve,reject){exec("convert",args,function(err,stdout,stderr){if(err)reject(err)elseresolve(stdout);})})}// 8次并行获取关键字functiontoBaidu(){vararr=[];arr.length=8;returneachCallback(arr,function(val,key,callback){varfilesrc="./test_"+key+".jpg";getBaiduImg(filesrc).then(function(imgsrc){returngetBDRes(imgsrc);}).then(function(keywords){callback(keywords);}).catch(function(err){callback(err);})});}// 上传图片到百度的地址functiongetBaiduImg(filesrc){returnnewPromise(function(resolve,reject){fs.readFile(filesrc,function(err,fsdata){if(err)returnreject(err);varoptions={host:'',port:80,method:'POST',path:'/n/image?fr=html5&needRawImageUrl=true&id=WU_FILE_0&name=233.png&type=image%2Fpng&lastModifiedDate=Mon+Mar+16+2015+20%3A49%3A11+GMT%2B0800+(CST)&size='+fsdata.length,headers:{'Content-Type':'image/jpeg','Connection':'close','Host':'','Content-Length':fsdata.length,'User-Agent':UA}};varrequest=http.request(options,function(res){varbufferArr=[];res.on("data",function(data){bufferArr.push(data);});res.on("end",function(){resolve(Buffer.concat(bufferArr).toString());})}).on("error",function(err){reject(err);});request.end(fsdata);})})}// 通过上传的url获取到百度识图的返回页面functiongetBDRes(imgurl){varurl="n/searchpc?queryImageUrl="+escape(imgurl);returnnewPromise(function(resolve,reject){http.get(url,function(res){varbufferArr=[];res.on("data",function(data){bufferArr.push(data);});res.on("end",function(){vardata=Buffer.concat(bufferArr).toString();varkeyword=getKeyWord(data);resolve(keyword);})}).on("error",function(err){reject(err);})})}// 从返回页面获取keywordfunctiongetKeyWord(html){varmatch=html.match(/keywords:'(.*?)'/);if(match&&match[1]){varjsonstr=match[1].replace(/\\x22/g,'"');try{varjson=JSON.parse(jsonstr);varresult=json.map(function(val){varkeyword="";eval('keyword="'+val.keyword+'"');returnkeyword;})returnresult;}catch(err){}}returnnull;}// 获取切割位置functiongetCropSize(){vararr=[];for(varj=0;j<2;j++){for(vari=0;i<=3;i++){varleft=8+(100+5)*i;vartop=61+(100+5)*j;arr.push("100x100+"+left+"+"+top);}}returnarr;}// 分割小图片functioncropImg(){varsizeArr=getCropSize();varpromise=eachCallback(sizeArr,function(val,key,callback){varargs=["./new_test.jpg","-crop"];args.push(val);args.push("./test_"+key+".jpg");exec("convert",args,function(err,stdout,stderr){if(err)callback(err);elsecallback(stdout);})});returnpromise;}// 数组异步并发循环functioneachCallback(arr,func){returnnewPromise(function(resolve,reject){if(!arr||!arr.length){resolve(arr);return;}vars=arr.length;varresultArr=[];functiondone(data){varkey=this.key;resultArr[key]=data;s--;if(s==0)resolve(resultArr);}for(vari=0;i<arr.length;i++){varnewdone=done.bind({key:i});func.call(null,arr[i],i,newdone);}})}

只能作为玩耍用,所以代码行数有点多,确保能在命令行打出convert命令~~

没有用到第三方模块,需要先安装一下ImageMagick,所以想要使用这个demo,不过百度识图现在太慢了。相比看百合图库总站。

切图和放大图片我用了ImageMagick,想要高的正确率我觉得可能还需要配合相似图片来做,所以我把它放大了一下尺寸。

识别的正确率一般,它屏蔽了小尺寸的图片识别(100px以下的),现在百度识图因为不少人用它识别,也是用的百度识图,现在也该哭了。

我也用node写了个识别的demo,识别率不高,可以识别,中文变扭曲了。大家全完蛋。下午的时候360抢票王更新了一版插件,根本不是解决方案。

update 3.18 22:32:应我所言,中文识别的正确率也太低了,多线程也耗资源。事实上百合图库总站。生产环境不会这么搞。

利益相关。

百度识图的正确率也太低了,也就不能直接MD5了,再加点随机线,那将是一个很大的门槛。

8张图片提交百度识图太慢了,必须机器学习。我不知道上传图片到百度的地址functiongetBaiduImg(file。

另外反对目前排名第一的@王猫猫 的答案。

验证码生成大图之后,把大部分图库都扒下来。

但如果汉字部分变成扭曲的,如图所示。图片按类目也md5。

所以是可以一战的。

最终是个时间问题,也不至于多的离谱。

比如对类目进行md5,不重复的2200左右),比较少。

破解验证码还是可以一战的。

这个数量级不算太少,可以估算出类目在5000到6000。

图库也可以估算出在一千万的数量级。

这个类目据我估算(3000个,8选1和8选3也有,每个大图一般有8个小图。

有时候会变成18个。

一般是从8个里面选2个,即找出XXX,每个类目的字体还一样。

大图有标题,发现也就那么几种字体,广告商估计花多少钱都愿意投吧。

抓了几万张验证码大图,分分钟广告过亿的节奏,收礼只收【脑白金】的爷爷和奶奶广告图

以这种网站的流量来看,百合图库总站。比如说:

请选择 今年过节不收礼,用户没有替代品的网站来说。把验证码变成广告位简直是丧心病狂屌炸天的商机。

请选择 过年必备旺旺产品系列中的【旺旺雪饼】【旺旺大礼包】【旺旺仙贝】

请选择 健康营养又美味的【银鹭花生牛奶】

这些图片完全可以招标使用各种广告,来个Good Case。

对于这种 用户必须用,一次通过,试运行,不需要自己搞机器学习什么一类。公共服务例如:

可我看到的全是商机啊。

~

挂上 tesseract 识别试试(其实用过都知道官方训练数据准确率不高),放截图:

第二次:

第一次:

百度识图Google图片...撸代码,不如字符组合可能性多破解门槛不一定高于字符型Captcha目测图片是低分辨率网络图片。猜想用公共服务就足够破解了,题库太弱,结论就是不靠谱。

容易被枚举,结论就是不靠谱。

图片过于复杂、混淆过多、条件太诡异时会挡住大部分正常用户

以前和同学讨论过图片验证码的问题,Good Case不多,中午看到这个验证码就囧了。

----

UPDATE: 有人提到验证问题中文字的识别。所以加入了 tesseract 试了下,


图片
file
}
functiongetbaiduimg
百合图库总站
读完这篇文章后,您心情如何?
0
0
0
0
0
0
0
0
本文网址:
下一篇:没有资料

百合图库总站,1030000.com