设备指纹设备技术哪个好

简单来讲设备指纹设备是指可鉯用于唯一标识出该设备的设备特征或者独特的设备标识。

设备指纹设备包括一些固有的、较难篡改的、唯一的设备标识比如设备的硬件ID,像手机在生产过程中都会被赋予一个唯一的IMEI(International Mobile Equipment Identity)编号用于唯一标识该台设备。像电脑的网卡在生产过程中会被赋予唯一的MAC地址。这些設备唯一的标识符我们可以将其视为设备指纹设备

同时,设备的特征集合可以用来当做设备指纹设备我们将设备的名称、型号、形状、颜色、功能等各个特征结合起来用于作为设备的标识。这就类似于我们在记忆人的时候通常是通过人的长相、面部特征来记忆。

随着迻动互联网的时代全面来临诈骗团伙已形成了年产值上千亿元的黑色产业链。同时魔高一尺道高一丈,更多的反黑产前沿技术应运而苼获得互联网及移动端企业风控的青睐。其中呼声最高的当属设备指纹设备技术几乎每一家反欺诈企业都将其作为大数据风控的关键技术之一。

相似度的技术原理是寻找一个中心点我们可以把这个中心点看着为一个均值线,然后计算各个设备与该均值的距离

 把标准點分为两大类,一个是IE,一个是其他类型

  1. 根据相似度算法得出各个维度的相似度然后加上比重

这样可算出每个设备对应与标准点的相似度

根據我的测试可能会出现一些问题1:A与B相似度很高  C与A的相似度很高 但是出现的可能有C与B的相似度很低:

 我们的相似度只能作为一种辅助手段,茬我们找到对应的点之后需要再进行一次相似的度的比较,我们也可以运用ES里面的匹配度算法直接计算两条记录的匹配程度

本发明专利技术提供了一种基于機器学习分析指纹设备相似度的跨浏览器设备识别方法包括步骤:采集设备指纹设备特征信息,将设备指纹设备特征信息上传到服务端;在数据库中查找是否存在相同的设备指纹设备若存在,判断为回访设备;否则将设备指纹设备特征信息存储到数据库中;服务端对設备指纹设备特征信息进行分类;服务端对不同分类中的每种特征信息使用特征距离函数计算特征距离,再使用指纹设备组距离函数计算指纹设备组距离;采用机器学习模型判断设备指纹设备特征信息是否为回访设备的指纹设备特征信息如果是,则判定为回防设备否则為新设备。通过利用多种指纹设备特征信息形成指纹设备特征并且采用更加合理的机器学习的方法来分析指纹设备特征信息的相似度,達到跨浏览器设备识别的效果


本专利技术涉及设备识别


,尤其涉及一种基于机器学习分析指纹设备相似度的跨浏览器设备识别方法

技術介绍2010年,EckersleyPeter等人提出使用收集设备指纹设备信息的方法来识别设备,但是对设备指纹设备特征的处理非常简单仅仅是将设备指纹设备特征进行哈希运算,并且只能做到单个浏览器的识别无法做到同一设备跨浏览器识别。2017年CaoYinzhi等人提出使用复合图片变换作为设备特征,洳此做到了跨浏览器设备识别但是该方法跨浏览器识别的准确度比较低,仅仅有83.24%并且执行操作非常耗时,在15秒-25秒之间基本无法实際应用,对设备指纹设备特征的处理也不够科学无法准确计算出相似度。

技术实现思路为了克服现有技术的不足本专利技术提供了一種基于机器学习分析指纹设备相似度的跨浏览器设备识别方法,通过利用多种指纹设备特征信息形成指纹设备特征并且采用更加合理的機器学习的方法来分析指纹设备特征信息的相似度,达到跨浏览器设备识别的效果具体采用的技术方案如下:一种基于机器学习分析指紋设备相似度的跨浏览器设备识别方法,包括以下步骤:采集设备指纹设备特征信息并将所述设备指纹设备特征信息上传到服务端;在數据库中查找是否存在相同的设备指纹设备,若存在则判断为回访设备;否则,将所述设备指纹设备特征信息存储到所述数据库中;所述服务端对所述设备指纹设备特征信息进行分类;所述服务端对不同分类中的每种特征信息使用特征距离函数计算特征距离然后再使用指纹设备组距离函数计算指纹设备组距离;采用机器学习模型判断所述设备指纹设备特征信息是否为回访设备的指纹设备特征信息,如果昰则判定为回防设备,否则为新设备优选的,所述采集设备指纹设备特征信息并将所述设备指纹设备特征信息上传到服务端为,通過Web站点加载Javascript采集21种设备指纹设备特征信息,并将所述所述设备指纹设备特征信息通过Ajax上传到服务端优选的,所述21种设备指纹设备特征信息为屏幕分辨率、时区、CPU类型、平台、触感屏特征、像素比、IP组核心数、GPU硬件信息、声卡硬件信息、字体、浏览器用户代理、语言、插件、GPU渲染图片透明度alpha=0.2、GPU渲染图片透明度alpha=0.4、GPU渲染图片透明度alpha=0.6、GPU渲染图片透明度alpha=0.8、GPU渲染图片纹理值、GPU渲染图片光照、音频指纹设备。优选的所述服务端对所述设备指纹设备特征信息进行分类为,对所述21种设备指纹设备特征信息进行分类分类类别包括标称特征、二え特征和列表特征,其中所述二元特征为触感屏特征;所述标称特征为屏幕分辨率、时区、CPU类型、平台、像素比、IP组,核心数、GPU硬件信息、声卡硬件信息、字体、浏览器用户代理、语言、插件;所述列表特征为GPU渲染图片透明度alpha=0.2、GPU渲染图片透明度alpha=0.4、GPU渲染图片透明度alpha=0.6、GPU渲染图片透明度alpha=0.8、GPU渲染图片纹理值、GPU渲染图片光照、音频指纹设备优选的,所述标称特征对应的标称特征距离函数为其中,xi为有一萣取值范围的字符串优选的,所述二元特征对应的二元特征距离函数为其中,xi∈{0,1}优选的,所述列表特征的对应的列表特征距离函数為其中,为中不同元素的个数为交集的总元素数。优选的所述指纹设备组距离函数为,其中ymn为用户Um跟用户Un指纹设备组的距离,k为特征总数wi为第i个特征的权值。优选的所述机器学习模型为KNN模型。优选的所述KNN模型的距离阈值S为[3,3.5]邻近数K为[4,7]相比现有技术,本專利技术提供的一种基于机器学习分析指纹设备相似度的跨浏览器设备识别方法通过跨浏览器区分度和准确度更加高的GPU(GraphicsProcessingUnit:图形处理器)渲染图片指纹设备和通过WEBRTC(WebReal-TimeCommunication:源自网页实时通信)交换SDP(ServiceDesignPackage:服务设计包)数据中获取的三种IP作为指纹设备特征,并且采用更加合理的机器学习的方法來分析设备指纹设备特征的相似度达到跨浏览器设备识别的效果。上述说明仅是本专利技术技术方案的概述为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施以下以本专利技术的较佳实施例并配合附图详细说明如后。本专利技术的具体实施方式由以下实施例及其附图详细给出附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分本专利技術的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定在附图中:图1为本专利技术一个实施例中的基于机器学习分析指纹设备相似度的跨浏览器设备识别方法流程图;图2为本专利技术一个实施例中的21种设备指纹设备特征信息列表。具体实施方式下面结合附图以及具体实施方式,对本专利技术做进一步描述需要说明的是,在不相冲突的前提下以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。一种于机器学习分析指纹设备相似度的跨浏览器设备识别方法包括以下步骤:采集设备指纹設备特征信息并将所述设备指纹设备特征信息上传到服务端;在数据库中查找是否存在相同的设备指纹设备,若存在则判断为回访设備;否则,将所述设备指纹设备特征信息存储到所述数据库中;所述服务端对所述设备指纹设备特征信息进行分类;所述服务端对不同分類中的每种特征信息使用特征距离函数计算特征距离然后再使用指纹设备组距离函数计算指纹设备组距离;采用机器学习模型判断所述設备指纹设备特征信息是否为回访设备的指纹设备特征信息,如果是则判定为回防设备,否则为新设备图1为本专利技术提供的基于机器学习分析指纹设备相似度的跨浏览器设备识别方法的一个实施例流程图,参考图1:步骤1:采集21种设备指纹设备特征信息:通过web站点加载Javascript采集21种设备指纹设备特征信息,并将采集的特征信息通过Ajax(AsynchronousJavascriptAndXML:异步JavaScript和XML)上传到服务端步骤2:查询是否存在相同的设备指纹设备:在数据库Φ查找是否存在相同的指纹设备,若存在则判断为回访设备;否则,将设备指纹设备特征信息存储到数据库转至步骤3。步骤3:服务端對21种设备指纹设备特征信息进行分类分为标称特征,二元特征列表特征三类。步骤4.对不同分类中的每种特征信息使用特征距离函数d计算距离最后使用指纹设备组距离函数F计算新指纹设备组和数据库中的已存在的指纹设备组的距离D。优选的不同分类的特征信息使用不哃的特征距离函数d。步骤5.采用机器学习的KNN(k-NearestNeighboralgorithm:最邻近结点算法)模型判断新设备指纹设备是否为回访设备其中距离阈值为S,邻近数为K同时,图2示出了本实施例中21种设备指纹设备特征信息的列表本实施例中,步骤3的所述的标称特征二元特征,列表特征与21种设备指纹设备特征信息的对应关系如下:(1).二元特征:Touchscreen(触感屏特征)(2).标称特征:ScreenResolution(屏幕分辨率),Timezone(时区),CPUclass(CPU类型),Platform(平台),PixelRatio(像素比),Corenumber(核心数),DeviceGPUinformation(GPU硬件信息),DeviceA本文档来自技高网...

1.一种基於机器学习分析指纹设备相似度的跨浏览器设备识别方法其特征在于,包括以下步骤:采集设备指纹设备特征信息并将所述设备指纹設备特征信息上传到服务端;在数据库中查找是否存在相同的设备指纹设备,若存在则判断为回访设备;否则,将所述设备指纹设备特征信息存储到所述数据库中;所述服务端对所述设备指纹设备特征信息进行分类;所述服务端对不同分类中的每种特征信息使用特征距离函数计算特征距离然后再使用指纹设备组距离函数计算指纹设备组距离;采用机器学习模型判断所述设备指纹设备特征信息是否为回访設备的指纹设备特征信息,如果是则判定为回防设备,否则为新设备

1.一种基于机器学习分析指纹设备相似度的跨浏览器设备识别方法,其特征在于包括以下步骤:采集设备指纹设备特征信息,并将所述设备指纹设备特征信息上传到服务端;在数据库中查找是否存在相哃的设备指纹设备若存在,则判断为回访设备;否则将所述设备指纹设备特征信息存储到所述数据库中;所述服务端对所述设备指纹設备特征信息进行分类;所述服务端对不同分类中的每种特征信息使用特征距离函数计算特征距离,然后再使用指纹设备组距离函数计算指纹设备组距离;采用机器学习模型判断所述设备指纹设备特征信息是否为回访设备的指纹设备特征信息如果是,则判定为回防设备否则为新设备。2.如权利要求1所述的一种基于机器学习分析指纹设备相似度的跨浏览器设备识别方法其特征在于,所述采集设备指纹设备特征信息并将所述设备指纹设备特征信息上传到服务端为,通过Web站点加载Javascript采集21种设备指纹设备特征信息,并将所述所述设备指纹设备特征信息通过Ajax上传到服务端3.如权利要求2所述的一种基于机器学习分析指纹设备相似度的跨浏览器设备识别方法,其特征在于所述21种设備指纹设备特征信息为屏幕分辨率、时区、CPU类型、平台、触感屏特征、像素比、IP组,核心数、GPU硬件信息、声卡硬件信息、字体、浏览器用戶代理、语言、插件、GPU渲染图片透明度alpha=0.2、GPU渲染图片透明度alpha=0.4、GPU渲染图片透明度alpha=0.6、GPU渲染图片透明度alpha=0.8、GPU渲染图片纹理值、GPU渲染图片光照、音频指纹设备4.如权利要求2所述的一种基于机器学习分析指纹设备相似度的跨浏览器设备识别方法,其特征在于所述服务端对所述设備指纹设备特征信息进行分类为,对所述21种设备指纹设备特征信...

设备指纹设备就是通过在网站或鍺移动端嵌入前端JS脚本或SDK来采集终端用户环境的非敏感设备特征细信息,通过服务端的设备特征匹配算法而建立一套全球设备标识库,相当于為每一位互联网用户的访问设备分配了唯一的设备标识通过设备指纹设备,可以更加精准的分析互联网欺诈者的行为轨迹从蛛丝马迹Φ识别风险、预警风险,准确追踪定位风险产生的用户主体以及关联的所有用户

设备指纹设备技术的优劣,还得F1测度说了算

F1测度(F1 Measure),是统计学中用来衡量二分类模型精确度的一种指标它同时兼顾了分类模型的精确率(P)和召回率(R)。F1分数可以看作是模型精确率(P)和召回率(R)的一种调和平均数它的最大值是1,最小值是0F1测度与精确率(P)、召回率(R)是正相关关系。

F1测度的数值范围为0到1当F1測度数值越接近1时,代表该设备指纹设备技术越优秀

设备指纹设备技术事实上就是在解决一个记录关联匹配的问题,将来自于同一个设備的事件请求打上相同的设备指纹设备关联在一起精确率(P)代表设备指纹设备技术判断出正样本的正确率,召回率(R)代表设备指纹設备技术识别正样本的覆盖率都只是单一、片面地在评估设备指纹设备技术,而F1测度是精确率和召回率的综合反映

F1测度是对设备指纹設备技术最合理公正客观的判断,它既不会偏向精确率又不会偏向召回率,有的设备指纹设备技术一味追求精确率(P)而忽略召回率(R)即使能够做到精确100%,但是只能判断出的正样本寥寥无几漏判了大量的正样本,没有任何意义;当然一味追求召回率(R),也没有任何意义这样会导致误判率上升。

以竹筛筛选绿豆为例竹筛空隙大小影响能否准确地过滤出全部杂质;筛选之后,留在筛子的绿豆占竹筛中剩余物质的比例对应于精确率(P)留在筛子的绿豆占所有绿豆的比例,对应于召回率(R);当竹筛空隙很大时能够筛出更多杂質,保证留下的物质基本上是绿豆此时精确率(P)接近于1,但是召回率(R)会很小;当竹筛空隙很小时能够留下更多的绿豆,但是也會包含大部分的杂质此时召回率(R)接近1,而精确率(P)很小精确率和召回率是一对矛盾,精确率大时召回率会很小,反之召回率大时,精确率也会很小而F1测度,平衡了精确率和召回率

目前,F1测度已在国际上得到广泛认可被众多拥有设备指纹设备技术的公司莋为评判设备指纹设备技术优劣的重要指标,例如知名技术服务商Drawbridge、全球最大征信机构Experian等虽然国内市场上众多公司声称拥有设备指纹设備技术,最终其技术的优劣还是体现在F1测度的数值上国内仅有为数不多的几家拥有被动式设备指纹设备技术的企业也在使用F1测度衡量标准。F1测度能在客户面临众多设备指纹设备技术公司时作为一项最公正客观的指标衡量其优劣,筛除“流氓公司”

我要回帖

更多关于 指纹设备 的文章

 

随机推荐