您好,我这边想确认一下关于聚类算法能力的问题: 1. 当前聚类算法对数据规模是否有要求或限制? 例如如果输入 50 万条、1024 维的向量数据,是否能够正常完成聚类?大概对内存、耗时有什么要求? 2. 当前是否支持增量聚类 / 在线聚类? 也就是在数据持续流式进入的情况下: 新数据能够自动归入已有簇; 当出现明显不同的新类别时,能够自动生成新的簇; 新簇是作为一个新的类别,而不是被直接判定为噪声。 如果支持的话,想进一步了解一下具体实现方式以及适用场景。
您好,我这边想确认一下关于聚类算法能力的问题:
例如如果输入 50 万条、1024 维的向量数据,是否能够正常完成聚类?大概对内存、耗时有什么要求?
也就是在数据持续流式进入的情况下:
新数据能够自动归入已有簇;
当出现明显不同的新类别时,能够自动生成新的簇;
新簇是作为一个新的类别,而不是被直接判定为噪声。
如果支持的话,想进一步了解一下具体实现方式以及适用场景。