так... сразу спешу предупредить! 
если задача вам показалась простой вы не правильно поняли вопрос, или я не правильно его сформулировал.
есть два массива:
(0..10000)
(1..10000)
нужно узнать их процент схожести... при этом не сравнивать по элементно!....  
т.е. что-то вроде:
 сделать образы этих массивов, образы не должны превышать 10-20% от размерности исходного массива... по которым и определять схожесть их.... 
какие будут предложения?