工學博士 (計算機科學與技術), 清華大學, 中國, 2006.
社會網路挖掘, 社會影響力分析, 異構網路中的機器學習數據挖掘, 語義Web
研究興趣主要包括社會網路分析、數據挖掘和語義Web。具體來說,針對社會網路的建模、用戶行為跟蹤和網路結構演化進行了深入研究。曾在伊利諾伊香檳分校、香港中文大學、香港科技大學、魯汶大學進行學術訪問,是多個國家級項目和多個國際合作項目的負責人。主要創新性研究包括:1)語義信息抽取,針對不同類型的數據源提出多種信息抽取方法,並將其成功套用於多個系統中;2)基於話題的信息搜尋,和傳統的關鍵字搜尋以及對象搜尋不同,研究的話題搜尋主要側重於如何理解文檔和查詢的話題語義信息,以及如何基於話題分布進行相關匹配;3)網路行為建模和影響力分析,提出了針對社會網路的微觀動態分析方法,並首次提出了社會影響力的量化分析方法,以及社會網路行為和社會影響力關聯關係的分析方法。套用上述研究成果,研發了研究者社會網路ArnetMiner系統,該系統收集了100多萬名研究者、300萬篇論文信息、3700多萬引用關係以及8000多個會議信息。從2006年運行以來,該系統吸引了189個國家73萬個獨立IP的訪問(6千960萬訪問日誌),訪問量還在以每月10%左右的速度增長。ArnetMiner系統在國際頂級會議WWW、KDD、ISWC、ICDM中進行了演示,得到一致好評,系統數據還被廣泛套用於科學研究,在國際上具有一定的影響力。曾被邀請訪問美國IBM TJ Watson研究院、美國UIUC大學、香港科技大學、香港中文大學、魯汶大學、Google China、MSRA、IBM CRL進行學術交流。已申請相關技術專利7項,研究成果還在與IBM、Google、Nokia、國際最大的石油公司、搜狐和中國科學技術信息研究所的多個國際合作和企業合作項目中得到推廣套用。在標準制定方面,參加了國家中文新聞置標語言和分類標準的制定。
國家自然科學基金課題: 統一的語義內容標註模型研究 (2008-2010);國家自然科學基金重點課題: 面向Web的社會網路理論與方法研究 (2010-2013);863課題: 基於機率圖模型的異構XML數據集成與檢索 (2009-2010);IBM國際合作項目: 社會網路搜尋和挖掘 (2007-2011);Nokia國際合作項目: 基於移動終端的本體場景建模和管理 (2009-2011).
國際SIMagine開發大賽: Telcel Award (2007).清華大學2007年度計算機系先進工作者2006年度計算機學會優秀博士論文提名獎2006年度清華大學優秀博士論文二等獎2005年度計算機系提名“學術新秀”候選人(計算機2名,參加學校評選)2005年度計算機系優秀黨員(研究生3人)2003-2005年度清華大學一等獎學金,包括:IBM獎學金(每年清華5名,計算機系2名),Intel獎學金 (每年清華5名,計算機系2名)和三菱商事獎學金
首次提出基於隱含話題的異構社會網路建模和社會網路影響力分析模型;針對Web信息的不同特點,提出多種有效的語義標註方法;提出的基於貝葉斯決策的多策略本體映射模型,在國際評測OAEI中獲得多項第一的優秀成績。
在國際期刊和國際會議上發表論文五十餘篇(其中SCI索引18篇,EI索引32篇),包括KDD, IJCAI, SIGMOD, ACL, ICDM, SDM, CIKM, TKDE, JWS, JDS。申請發明專利6項,google scholar統計引用250餘次數。是國家863計畫、國家自然科學基金等國家級、部委級和國際合作等11項研究項目的負責人。是國際期刊JAIT, JSW的編委會委員,TKDD的特邀編輯,多個國際Workshop的主席,擔任50多個國際會議的程式委員。在Web挖掘和語義Web及其相關領域建立了良好的學術影響。
研發的學術搜尋系統ArnetMiner的系統用戶已覆蓋180個國家。研究成果還在與IBM、Google、Nokia、搜狐的多個國際合作和企業合作項目中得到推廣套用。
J. Tang, J. Zhang, R. Jin, Z. Yang, K. Cai, L. Zhang, and Z. Su. Topic Level Expertise Search over Heterogeneous Networks. Machine Learning Journal, (to appear). J. Tang, L. Yao, D. Zhang, and J. Zhang. A Combination Approach to Web User Profiling. ACM Transactions on Knowledge Discovery from Data, (to appear). J. Li, J. Tang, Y. Li, and Q. Luo. RiMOM: A Dynamic Multi-Strategy Ontology Alignment Framework. IEEE Transaction on Knowledge and Data Engineering. August 2009 (vol. 21 no. 8) pp. 1218-1232. J. Tang, J. Li, B. Liang, X. Huang, Y. Li, and K. Wang. Using Bayesian Decision for Ontology Mapping. Journal Web Semantics, Vol., no. 4, pp.243-262, Dec. 2006. C. Tan, J. Tang, J. Sun, Q. Lin, and F. Wang. Social Action Tracking via Noise Tolerant Time-varying Factor Graphs. Proc. of 16th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2010), Washington, DC, 2010. C. Wang, J. Han, Y. Jia, D. Zhang, Y. Yu, J. Tang, and J. Guo. Mining Advisor-Advisee Relationships from Research Publication Networks. Proc. of 16th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2010), Washington, DC, 2010. J. Tang, J. Sun, C. Wang, and Z. Yang. Social Influence Analysis in Large-scale Networks. Proc. of 15th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2009).Paris, France, 2009, pp. 807-816. J. Tang, J. Zhang, L. Yao, J. Li, L. Zhang, and Z. Su. ArnetMiner: Extraction and Mining of Academic Social Networks. Proc. of 14th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2008). Henderson, Nevada, 2008, pp.990-998. J. Tang, H. Li, Y. Cao, and Z. Tang. Email Data Cleaning. Proc. of 11th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2005), Chicago, Illinois, USA, 2005, pp. 489-499. J. Tang, H. Leung, Q. Luo, D. Chen, and J. Gong. Towards Ontology Learning from Folksonomies. Proc. of 21st Intl. Conf. on Artificial Intelligence (IJCAI 2009), Pasadena, California, pp. 2089-2095. Q. Zhong, H. Li, J. Li, G. Xie, J. Tang, and L. Zhou. A Gauss Function based Approach for Unbalanced Ontology Matching. Proc. of 21st Intl. Conf. on Management of Data (SIGMOD 2009), Providence, Rhode Island, 2009, pp.669-680. C. Zhu, J. Tang, H. Li, H. T. Ng, and T. Zhao. A Unified Tagging Approach to Text Normalization. Proc. of 45th Intl. Conf. of the Association of Computational Linguistics (ACL 2007), Prague, Czech Republic, 2007 pp. 688-695
ACM TKDD, TIST: 特邀編輯;JSW, SWJ, JAIT: 編委;Web Intelligence 2010: 程式委員會副主席 (2010);KDD-LDMTA 2010, ICDM-LDMTA 2009-2010, WWW-SWSM 2008, CIKM-SWSM 2009: 聯合主席 (2008-2010);KDD 2010, SIGIR 2009-2010, WWW 2010, ACL 2010, COLING 2010: 程式委員會委員 (2009-2010).