以下是一些常用的人工智能數(shù)據(jù)集: 1. CIFAR-10:包含了60,000張彩色圖片,共分為10個類別。 2. MNIST:包含了60,000張灰度圖片,用于手寫數(shù)字識別任務。 3. ImageNet:包含了超過14,000,000張圖像,涵蓋了超過20,000個類別。 4. COCO:包含了超過200,000張圖像,用于圖像注釋、圖像分割等任務。 5. 20 Newsgroups:包含了20個主題的新聞組文章,用于文本分類任務。 6. IMDB電影評論數(shù)據(jù)集:包含了50,000條電影評論,分為正面和負面兩類。 7. Enron電子郵件數(shù)據(jù)集:包含了50萬封郵件的數(shù)據(jù),可用于文本數(shù)據(jù)分析任務。 8. LFW人臉識別數(shù)據(jù)集:包含了13,000多張名人的面部圖像。 9. Penn Treebank:包含了超過4.5百萬個單詞的新聞文章,用于語言建模等任務。 10. SQuAD:包含了10萬個問題和40萬個答案的數(shù)據(jù)集,用于問答系統(tǒng)等任務。 以上只是一小部分常見的人工智能數(shù)據(jù)集,還有很多其他領(lǐng)域的數(shù)據(jù)集可供使用。 |
|