-
熱度指數(shù):32
時(shí)間限制:C/C++ 1秒,其他語言2秒
空間限制:C/C++ 256M,其他語言512M
-
算法知識(shí)視頻講解
實(shí)現(xiàn)一個(gè)函數(shù)來生成數(shù)據(jù)集的隨機(jī)子集。這在機(jī)器學(xué)習(xí)中常用于數(shù)據(jù)采樣、交叉驗(yàn)證和集成學(xué)習(xí)等場(chǎng)景。函數(shù)需要支持有放回和無放回兩種采樣方式。
輸入描述:
函數(shù)`get_random_subsets`接收四個(gè)參數(shù):
1. X:特征矩陣,二維numpy數(shù)組,形狀為(n_samples, n_features)
2. y:標(biāo)簽向量,一維numpy數(shù)組,形狀為(n_samples,)
3. n_subsets:需要生成的子集數(shù)量,整數(shù)
4. replacements:是否允許重復(fù)采樣,布爾值,默認(rèn)為True
輸出描述:
返回一個(gè)列表,包含n_subsets個(gè)元組:
- 每個(gè)元組包含(X_subset, y_subset)
- X_subset是特征子集
- y_subset是對(duì)應(yīng)的標(biāo)簽子集
- 所有數(shù)組都轉(zhuǎn)換為Python列表
示例1
輸入
[[1, 2], [3, 4], [5, 6]]
[0, 1, 0]
2
輸出
[([[5, 6], [1, 2], [5, 6]], [0, 0, 0]), ([[5, 6], [1, 2], [1, 2]], [0, 0, 0])]
備注:
1.對(duì)應(yīng)的輸入、輸出已給出,您只用實(shí)現(xiàn)核心功能函數(shù)即可。
2.支持numpy、scipy、pandas、scikit-learn庫。