Проблемы с использованием Jama в java для LSA

Я использую пакет jama для поиска lsa. Мне сказали уменьшить размерность, и поэтому в этом случае я уменьшил ее до 3 и восстановил матрицу. Но результирующая матрица сильно отличается от той, которую я дал системе.

вот код

    a = new Matrix(termdoc); // get the matrix here 
    a = a.transpose() ; // since the matrix is in the form of doc * terms i transpose it 
    SingularValueDecomposition sv =new SingularValueDecomposition(a) ; 
    u = sv.getU();
    v = sv.getV(); 
    s = sv.getS();
    uarray = u.getArray();
    sarray = s.getArray(); 
    varray = v.getArray(); 
    sarray_mod = new double[3][3]; //reducing dimension 
    uarray_mod = new double[uarray.length][3];
    varray_mod = new double[3][varray.length]; 
    move(sarray,3,3,sarray_mod); // my method to move the contents 
    move(uarray,uarray.length,3,uarray_mod); 
    move(varray,3,varray.length,varray_mod); 
    e = new Matrix(uarray_mod); 
    f = new Matrix(sarray_mod);
    g = new Matrix(varray_mod);
    Matrix temp  =e.times(f); 
    result = temp.times(g); 
    result = result.transpose(); 
    results = result.getArray() ; 
    System.out.println(" The array after svd : \n"); 
    print(results);// my method to print the array 

 private static void move(double[][] sarray2, int r, int c,
        double[][] sarrayMod) {
    // TODO Auto-generated method stub 
    for(int i=0;i<r;i++)
        for(int t=0;t<c;t++)
            sarrayMod[i][t]=sarray2[i][t];

}

Пример вывода всего из 3 файлов, два из которых похожи

0.25 0 0 0 0 0 0 0 0.25 0 0.25 0.25 0 

0 0.083 0.083 0.083 0.083 0.083 0.083 0.083 0 0.083 0.083 0.167 0.083 

0.25 0 0 0 0 0 0 0 0.25 0 0.25 0.25 0 

Массив после svd :

0.225 0.029 0.029 0.029 0.029 0.029 0.029 0.029 0.225 0.029 0.253 0.282 0.029 

-0.121 0.077 0.077 0.077 0.077 0.077 0.077 0.077 -0.121 0.077 -0.044 0.033 0.077 

0.245 0.012 0.012 0.012 0.012 0.012 0.012 0.012 0.245 0.012 0.257 0.269 0.012 

person CTsiddharth    schedule 30.01.2012    source источник


Ответы (1)


Просмотрите пример Здесь

В примере мы берем первые 2 столбца из U, S и V. А потом мы их умножаем. Это не приведет к тому, что вы получите ту же матрицу, но улучшите производительность при сходстве.

Если вы просмотрели пример, то обнаружите, что сходство между пользователем и человеком было на -ve. Но после того, как мы выполнили SVD, сходство увеличилось до значения +ve, близкого к 1.

Я думаю, что вы двигаетесь правильно. Просто просмотрите пример один раз.

person Debaditya    schedule 31.01.2012