郭宇红
- 作品数:13 被引量:63H指数:4
- 供职机构:国际关系学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于FP-Tree的反向频繁项集挖掘被引量:22
- 2008年
- 在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个给定约束的目标FP-tree;然后根据目标FP-tree生成一个仅含频繁项的临时事务数据库TempD;最后通过向TempD中撒入非频繁项得到目标数据集.理论分析和实验表明该方法是正确的、高效的,且与现有方法仅能输出1个目标数据集相比,该方法能够输出较多的目标数据集.
- 郭宇红童云海唐世渭杨冬青
- 关键词:FP树频繁项集隐私保护知识隐藏
- 隐私保护频繁项集挖掘中的细粒度随机化模型被引量:1
- 2019年
- 已有的随机化回答模型调控的数据范围宽、粒度粗,对隐私数据的保护粒度缺乏灵活性,无法实现精细化、个性化、差异化的隐私保护。提出三类多参数随机化回答模型,包括行多参、复合多参、分组多参共11种随机化回答模型,给出了模型的分类框架和分类层次。细粒度多参数随机化模型可实现精细化、个性化、差异化的隐私保护效果。
- 郭宇红童云海
- 关键词:随机化回答隐私保护频繁项集
- SPSS Clementine决策树建模在图书馆中的应用被引量:6
- 2014年
- 分析影响读者借阅量的因素,确定不同读者的借阅需求,进而依据需求定制差异化的借阅权限和服务。利用SPSS Clementine挖掘工具,采用C5.0决策树算法,对国际关系学院图书馆的读者借阅数据进行挖掘,建立读者决策树分类模型,将读者按借阅频度分为活跃读者、一般读者和沉默读者。结果表明,读者身份、专业、年级和性别对借阅量有重要影响,本科大三学生借阅需求较大,大四学生借阅需求小。决策树分类能对图书馆读者进行细分,可为调整读者借阅权限提供理论依据。
- 郭宇红王路宁毛玉琪
- 关键词:决策树图书馆CLEMENTINE借阅权限
- 融合XGBoost计算特征权重的时间序列预测方法
- 本发明提供一种融合XGBoost计算特征权重的时间序列预测方法,属于数据处理技术领域,该方法包括:从数据库中获取与所预测时间序列变量相关的多个类型的特征信息;根据时间序列变量、特征信息和XGBoost模型,学习得到各个决...
- 郭宇红马海森
- 一种基于AHP的智能电影推荐方法被引量:6
- 2015年
- 电影网站提供了十分丰富的电影资源,然而用户必须花费大量时间搜索自己感兴趣的资源,如何帮助用户快速找到其想要的资源成为大型电影网站的重要需求。智能推荐技术的提出使满足这个需求成为可能。文中提出一种基于AHP(Analytic Hierarchy Process)层次分析法的智能电影推荐方法,综合考虑电影印象、故事、表演、导演、画面、音乐和类型等因素,通过用户对各因素两两比较、权重计算,生成个性化推荐列表。基于时光网的多个用户实证研究表明,结合AHP的智能电影推荐方法简单、有效,大部分推荐结果满足用户喜好。
- 郭宇红杨金然
- 关键词:层次分析法电影推荐
- 分组随机化隐私保护频繁模式挖掘被引量:2
- 2021年
- 已有的隐私保护频繁模式挖掘随机化方法不考虑隐私保护需求差异性,对所有个体运用统一的随机化参数,实施同等的保护,无法满足个体对隐私的偏好.提出基于分组随机化的隐私保护频繁模式挖掘方法(grouping-based randomization for privacy preserving frequent pattern mining,简称GR-PPFM).该方法根据不同个体的隐私保护要求进行分组,为每一组数据设置不同的隐私保护级别和与之相适应的随机化参数.在合成数据和真实数据中的实验结果表明:相对于统一单参数随机化mask,分组多参数随机化GR-PPFM不仅能够满足不同群体多样化的隐私保护需求,还能在整体隐私保护度相同情况下提高挖掘结果的准确性.
- 郭宇红童云海苏燕青
- 关键词:随机化个性化隐私保护频繁模式挖掘
- 融合Motif结构高阶相似度的文献推荐算法
- 2023年
- 【目的】将协同过滤方法应用到文献推荐领域,融入用户余弦相似度网络中Motif结构反映出的高阶相似特征,提高推荐的质量。【方法】通过用户收藏文献的行为信息和文献间的引用关系构建用户对文献的偏好数据;在基于用户-文献收藏行为信息的用户余弦相似度网络中,利用网络中的子图——Motif结构捕获高阶相似度;最后将用户余弦相似度和基于Motif结构的高阶相似度融入矩阵分解推荐算法中,预测用户对文献的偏好。【结果】相较于传统的矩阵分解推荐算法,本文算法在RMSE和MAE指标上分别降低0.0482和0.0379。【局限】未考虑文献的时间衰减性。【结论】本文算法降低了用户偏好预测误差,提高了推荐质量。
- 陈柳郭宇红
- 关键词:MOTIF矩阵分解
- 带学习的同步隐私保护频繁模式挖掘被引量:4
- 2011年
- 为了提高挖掘结果的准确性,提出基于样例学习和项集同步随机化的隐私保护频繁模式挖掘方法(learning and synchronized privacy preserving frequent pattern mining,简称LS-PPFM).该方法充分利用不需要隐私保护的个体数据,首先对不需要保护的数据学习,得到样例数据中蕴涵的强关联项,然后在对数据随机化时,将强关联项绑定在一起作同步随机化变换,以保持项与项之间的潜在关联性.实验结果表明,相对于项独立随机化,LS-PPFM能够在略微牺牲一定的隐私保护性的情况下,显著提高频繁模式挖掘结果的准确性.
- 郭宇红童云海唐世渭吴冷冬
- 关键词:随机化隐私保护频繁模式挖掘
- 融合XGBoost计算特征权重的时间序列预测方法
- 本发明提供一种融合XGBoost计算特征权重的时间序列预测方法,属于数据处理技术领域,该方法包括:从数据库中获取与所预测时间序列变量相关的多个类型的特征信息;根据时间序列变量、特征信息和XGBoost模型,学习得到各个决...
- 郭宇红马海森
- 隐私保护频繁项集挖掘中的分组随机化模型被引量:4
- 2020年
- 通过对隐私保护频繁项集挖掘问题的研究,发现现有的单参数随机化回答模型调控的数据范围宽、粒度粗,导致无法实现精细化、差异化的隐私保护的问题.在沃纳模型、单参数等随机化模型的基础上,提出个体分组多参随机化PN/g模型,给出其在隐私保护频繁项集挖掘中的支持度重构方法.研究结果表明:该模型面向多样化、差异化的隐私保护需求,将N个不同个体分为若干组,每组设置不同的随机化参数,可实现差异化的隐私保护效果.实例分析表明:结合所提出的支持度重构方法,可实现基于分组随机化的隐私保护频繁项集挖掘,在保护不同群体隐私的同时,挖掘到有效的频繁项集与关联规则.
- 郭宇红童云海
- 关键词:随机化回答隐私保护频繁项集数据挖掘