DGraph
DGraph 表示大规模动态图数据集的集合,由随时间演变的交互式对象、事件和标签组成。 它提供了对海量现实世界数据执行多项任务(例如,节点分类、链接预测、图分类)的机会,并且具有广泛的应用,特别关注金融领域。 鉴于包含现实和有价值的图数据,基准数据集有望促进更多相关研究并扩大实际应用。
DGraph-Fin
DGraph-Fin 是一个有向的、未加权的动态图,由数百万个节点和边组成。它代表了 Finvolution Group 用户之间的社交网络,其中一个节点代表一个 Finvolution 用户,从一个用户到另一个用户的边表示该用户将另一个用户视为紧急联系人。此外,基于现实图数据的 DGraph-Fin 可以有效地促进对不断发展的社交网络的观察和理解。此外,动态图可以通过异常检测的方式自适应地应用于欺诈者的准确识别,有助于提高金融风险控制的效率和有效性。下面提供了数据集的说明性概述。
通过使用cogdl构建图结构数据以及使用cogdl提供的图神经网络算法可实现对Dgraph-fin数据集的节点分类任务。cogdl相比较于pygeometry和dgl更加直观且便于理解,对于GNN算法model修改也更为便捷。
DGraph数据集介绍:dgraph-web
cogdl baseline实现:cogdl/examples/dgraph at master · THUDM/cogdl · GitHub
Results:
Performance on DGraphFin(10 runs):
Methods | Train AUC | Valid AUC | Test AUC |
---|---|---|---|
SIGN | 0.7718 ± 0.0025 | 0.7724 ± 0.0027 | 0.7716 ± 0.0031 |
GIN | 0.7774 ± 0.0075 | 0.7594 ± 0.0069 | 0.7676 ± 0.0062 |
GraphSAGE | 0.7687 ± 0.0022 | 0.7521 ± 0.0021 | 0.7601 ± 0.0013 |
GAT | 0.6987 ± 0.0029 | 0.7233 ± 0.0012 | 0.7333 ± 0.0024 |
GCN | 0.7187 ± 0.0039 | 0.7093 ± 0.0048 | 0.7115 ± 0.0025 |
MLP | 0.7102 ± 0.0033 | 0.6987 ± 0.0029 | 0.7059 ± 0.0030 |
Mixhop | 0.6987 ± 0.0029 | 0.6895 ± 0.0055 | 0.6912 ± 0.0069 |
Grand | 0.6817 ± 0.0021 | 0.6815 ± 0.0025 | 0.6805 ± 0.0020 |
SGC | 0.6187 ± 0.0046 | 0.6136 ± 0.0043 | 0.6137 ± 0.0065 |