人工智能數(shù)據(jù)集

昵稱bp1S6 2024-01-17 發(fā)布于河南

展開全文

以下是一些常用的人工智能數(shù)據(jù)集：

1. CIFAR-10：包含了60,000張彩色圖片，共分為10個類別。

2. MNIST：包含了60,000張灰度圖片，用于手寫數(shù)字識別任務。

3. ImageNet：包含了超過14,000,000張圖像，涵蓋了超過20,000個類別。

4. COCO：包含了超過200,000張圖像，用于圖像注釋、圖像分割等任務。

5. 20 Newsgroups：包含了20個主題的新聞組文章，用于文本分類任務。

6. IMDB電影評論數(shù)據(jù)集：包含了50,000條電影評論，分為正面和負面兩類。

7. Enron電子郵件數(shù)據(jù)集：包含了50萬封郵件的數(shù)據(jù)，可用于文本數(shù)據(jù)分析任務。

8. LFW人臉識別數(shù)據(jù)集：包含了13,000多張名人的面部圖像。

9. Penn Treebank：包含了超過4.5百萬個單詞的新聞文章，用于語言建模等任務。

10. SQuAD：包含了10萬個問題和40萬個答案的數(shù)據(jù)集，用于問答系統(tǒng)等任務。

以上只是一小部分常見的人工智能數(shù)據(jù)集，還有很多其他領(lǐng)域的數(shù)據(jù)集可供使用。