(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210939964.7
(22)申请日 2022.08.05
(71)申请人 大连理工大 学
地址 116024 辽宁省大连市高新园区凌工
路2号
(72)发明人 付海燕 郭艳卿 王鑫磊 王波
刘航
(74)专利代理 机构 大连东方专利代理有限责任
公司 21212
专利代理师 吴婷婷 李洪福
(51)Int.Cl.
G06Q 40/02(2012.01)
G06Q 30/02(2012.01)
G06Q 20/38(2012.01)
G06Q 20/40(2012.01)G06F 21/60(2013.01)
G06F 21/62(2013.01)
G06F 21/64(2013.01)
G06K 9/62(2022.01)
G06N 5/00(2006.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于区块链的联邦随机森林模型建模
方法
(57)摘要
本发明提供一种基于区块链的联邦随机森
林模型训练方法, 包括: 参与方缴纳保证金; 选择
一定数量的验证方; 选举出一个聚合方; 获取每
个参与方提供的决策树模型最佳分裂特征, 由各
验证方验证局部模型; 由聚合方统计各验证方返
回的验证结果; 完整建立一棵决策树后, 由聚合
方打包所有树节点信息生 成区块, 并将区块广播
给所有参与方, 如果区块内的每个树节点信息都
被验证成功, 聚合方将带有其数据签名的区块存
储在区块链中。 本发明提出利用集成思想的随机
森林算法解决单棵决策树准确率低的问题, 基于
区块链技术的共识机制和防篡改的特点, 提高联
邦随机森林算法的安全性, 并制定奖励分配机
制, 吸引更多的机构参与模型训练, 从而提高联
邦系统的可扩 展性。
权利要求书2页 说明书7页 附图2页
CN 115375425 A
2022.11.22
CN 115375425 A
1.一种基于区块链的联邦随机森林模型建模方法, 其特征在于, 在 m个参与方中随机采
样样本和特征训练不同的t个决策树模 型, 并基于共识机制质量证明抵御恶意攻击, 具体包
括:
任意参与方在加入联邦系统之前缴纳保证金;
从所有参与 方中根据 上一轮训练表现选择一定数量的验证方, 所述验证方用于检验其
他参与方提供的局部模型质量是否提升;
从所有验证方中根据历史股份值投票选举出一个聚合方, 所述 聚合方负责 收集和打包
所有局部模型信息, 并向其 他参与方广播区块, 最终将生成的区块添加到区块链上;
获取每个参与方提供的决策树模型最佳分裂特征, 对于每个参与方新增的局部模型,
由各验证方进行验证, 验证数据集是本轮随机森林没有采集到的袋外数据;
由聚合方统计各验证方返回的验证结果, 从而确定新增分裂节点的有效性, 其中有效
性根据新增 局部模型后随机森林模型的准确性获得;
完整建立一棵决策树后, 由聚合方打包所有树节点信息生成区块, 并将区块广播给所
有参与方, 随后由各参与方对区块进行常规验证, 再 由验证方验证模型训练轨迹来审核区
块, 如果区块内的每个树节点信息都被验证成功, 聚合方将带有其数据签名的区块存储在
区块链中。
2.根据权利要求1所述的一种基于区块链的联邦随机森林模型建模方法, 其特征在于,
挑选验证方的标准为: 参与方对模型的贡献度越大, 获得的股份越多, 被选为验证方的概率
越大, 反之被选中概率越小; 首轮训练根据初始股份权重进 行挑选, 初始股份分配参考参与
方拥有的数据量大小、 竞争机构之间的共享声誉分数或者是来自社交网络的辅助信息 。
3.根据权利要求1所述的一种基于区块链的联邦随机森林模型建模方法, 其特征在于,
由聚合方统计各验证方返回的验证结果, 从而确定新增分裂节点的有效性, 包括: 如果准确
性较上一轮有提升或保持不变, 则节点增加有效, 根据准确 率提升的比例给予当前节点所
属的参与方相应的股份值;
如果准确性下降, 则节点存在不安全行为, 第一次给予警告, 并记录当前特征, 第二次
惩罚保证金的1/4, 并扣除对应的股份值, 第三次惩罚保证金的1/2, 扣除对应的股份值; 第
四次没收全部保证金, 并加入黑名单。
4.根据权利要求1所述的一种基于区块链的联邦随机森林模型建模方法, 其特征在于,
该方法还包括在训练过程中将各参与方 的训练细节及对各决策树模型的贡献度信息上链
后基于区块链公开, 再根据公开的训练细节及贡献度对各参与方进行 奖励。
5.根据权利要求4所述的一种基于区块链的联邦随机森林模型建模方法, 其特征在于,
根据公开的训练细节及贡献度对各参与方进行 奖励, 包括:
奖励诚实协作的参与方, 惩罚不按照 规定流程建模以及存在恶意行为破坏模型的参与
方;
鼓励正当的举报行为, 对于举报内容属实的举报者给予奖励, 惩罚恶意的举报行为, 并
且补偿受恶意举报行为影响的参与方。
6.根据权利要求5所述的一种基于区块链的联邦随机森林模型建模方法, 其特征在于,
奖励诚实协作的参与方包括根据参与方对模型的贡献度、 以及在训练过程中的计算消耗和
通信消耗获取参与方的收益;权 利 要 求 书 1/2 页
2
CN 115375425 A
2所述参与方对模型的贡献度由训练过程中累计的股份值以及参与方的特征重要性决
定, 所述股份值由某个特 征作为最优分裂特 征的次数、 准确性 提升度和举报奖惩因素决定;
所述特征重要性 根据以下计算获取:
其中, Wj为特征j的重要性评估记过, N是当前训练集样本总数, Nt是当前节点的训练样
本数, Ntl代表分裂后左子树的样本数, Ntr代表分裂后右子树的样本数, gini代表基尼指数,
ginil代表分裂后左子树的基尼指数, gi nir代表分裂后右子树的基尼指数;
根据以下计算获取参与方i获得的奖励Ri:
其中, α 为股 份制为权重因子, β 为特征重要 性权重因子, γ为能量消耗权重因子, Si为参
与方i的股份值, Wi为参与方i的特征重要性, Ei为参与方i的能量消耗, S为系统总股份值、 W
为特征重要性总和, E为总消耗能量。权 利 要 求 书 2/2 页
3
CN 115375425 A
3
专利 一种基于区块链的联邦随机森林模型建模方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:08上传分享