Course Project
Build an application based on GNN
Submit a project proposal to this post before 21st Aug. 2022
Flexibly use any modules in CogDL to help you build the application. For example, you can use DeepWalk/ProNE/GraphSAGE to generate node embedding in your application.
Some cases could be found in
1 个赞
proposal
姓名:田云
下游应用:异构图的embedding计算,进行节点聚类,完成相应的可视化应用,数据为投资行业数据(已有)。节点有一些node infomation。参考HetGNN,但会考虑有所改进,目前有个加入一个LSTM记忆过往投资偏好的想法。
具体技术:采样,消息传递,attention机制等
gpu资源:如果有的话可以联系我hh
1 个赞
proposal: 计算图的切分
姓名:秦林啸
下游应用:计算图是深度学习框架(Pytorch、TensorFlow等)计算参数梯度的关键技术,对计算图进行优化是提高模型性能的重要手段。
Wang 等人在计算图模型的基础上提出了将其切分,以实现分布式训练的 Double Recursive Algorithm (链接) ,但它分析BERT之类的大模型计算图耗时过长;苗旭鹏等人 (链接) 将GCN引入计算图的分析中,实现了计算图的自动优化。
准备利用GCN近似 Double Recursive Algorithm,完成计算图的分割任务。
具体技术:GCN用于有向图学习
需求:目前最大难点是建立用于训练的数据集,或者考虑用何种方法解决
1 个赞
roboti
2022 年8 月 18 日 01:34
#4
姓名:许玮
下游任务:学者或者论文的学科分类。
指导者:史小文、姜鹏
具体步骤:
(1)数据 : 利用aminer学术数据中部分质量较好的有已做学科分类专家库数据
(2)建图:构建包含专家,合作者,关键词(学者标签),论文,机构的异构图
(3)模型:有2个方案:1.GCN或者GraphSAGE直接构建分类模型; 2.自监督方式训练图embedding+MLP
(4)训练和评估:学科类别要有交叉(例如图像识别和自然语言处理),否则会有孤立的图。
评估:可用ai2000数据作算法实际应用的初步的评估
(5)已有设备:1台A100,
1 个赞
任务:XLore的图神经网络表示学习
姓名:屈亮亮
应用:实体链接
问题:如何将词条出现的上下文构建成文本图参与到XLore知识图中的训练中
1 个赞
YuLei
2022 年8 月 19 日 08:37
#6
proposal: R-Walk in Social Rules Learning
姓名:雷宇
下游应用:目前在社会规则学习上,大部分技术基于强化学习,但是这种情况比较难收敛,尤其在真实场景下,另外如何构建规则也需要结合人群。可以考虑deepwalk的方式,随机初始化几个起始点代表不同地域人群,图中每个节点代表某个规则,但是现实中规则比较复杂在不同的场景下,可以考虑剪枝,或者设置阈值的方式来加速收敛。在针对同一地域人群探究同一地域不同人对于社会规则的学习,可以使用迭代的方向。
具体技术:强化学习策略,deepwalk随机游走方式
需求:难点规则节点的设置,学习策略的设置,收敛的方案,不同地域人群的划分依据
1 个赞
姓名:程煜晴
题目:论文的冷启动消歧 (Name Disambiguation from Scratch)
任务:给定一组拥有同名作者的论文,能够返回一组论文聚类,使得一个聚类内部的论文都是一个人的,不同聚类间的论文不属于一个人。最终目的是识别出哪些同名作者的论文属于同一个人。
数据集:AMiner-Whoiswho同名消歧论文数据集
具体技术:在语义关系基础上,需要捕捉论文之间的网络关系,尝试gcn\hgcn等不同的方法
问题:如何更好地构建异构图,不同关系对于论文区分的重要程度
1 个赞
Name:郭嘉琛
Title:用户行为预测
Problem:首先是如何处理各种用户行为。比如用户商品之前存在的“点击边”和“收藏边”,对用户个性的刻画有什么不同的影响?相同的“点击边”对不同的商品——日用品&奢侈品,有什么不用的信号?不同时间长度的边,其影响力改如何衡量? 其次的挑战是冷启动问题。具体来讲, 是一些没有行为/行为很少的用户/商品节点,如何将他们纳入推荐体系? 第三个挑战在于何如处理边之上的时间信息。
Intuition:应用GraphSAGE+GBDT作为基本框架
Dataset:CIKM 2019 Ecommerce AI
Relevant Paper:Pinterest:Graph Convolutional Neural Networks for Web-Scale Recommender Systems YoutubeDNN:Deep neural network for Youtube recommendation
1 个赞
proposal:增量式论文的作者消歧
姓名:韩天翼
任务:在系统存在大量重名学者profile的条件下,将新加入系统的论文准确地分配给一个存在的学者
数据集:AMiner-Whoiswho同名消歧论文数据集
具体技术:unsup-graphsage生成作者和论文的embedding
问题:常见方案普遍依赖于较复杂的特征提取方案 ,并且最终通过待分配论文与已有论文的匹配来确定作者 本工作将尝试构建不同类型子图 直接推理出作者embedding去与待分配论文做匹配
1 个赞
姓名:张锦
下游任务:相似论文召回
具体步骤:1)特征工程; 2)(异构/同构图) 构建论文引用网络; 3)生成emb;4)相似论文recall;
需求:论文&引用关系数据集;
1 个赞
jhh
2022 年8 月 23 日 16:30
#12
Proposal:论文 venue 预测
姓名:姜皓瀚
课题描述: 通过图中论文之间的引用关系和论文 venue,判断未知论文的 venue
计划对比测试课程中的几种算法和基础模型,选择性能和结果较好的组合。数据源使用aminer开放数据集AMiner
1 个赞