Tenho uma lição de casa na qual tenho que calcular e plotar alguns pontos usando uma transformação em perspectiva, mas não tenho certeza de que meus resultados estejam corretos, pois o gráfico 3D usando coordenadas de câmera parece muito diferente do gráfico 2D usando as coordenadas da imagem . Você pode me ajudar a entender o que há de errado?
É o seguinte: A câmera está no ponto W T C = [ - 1 , 1 , 5 ] T , especificado nas coordenadas do mundo (em metros). A câmara do sistema de coordenadas é girado em torno do eixo Y da referência mundo por θ = 160 o , por isso, de matriz de rotação é w R c = [ c o s ( θ ) 0 s i n ( θ ) 0 1 0 - s i n (
Câmara parâmetro são as seguintes: , , ,
Pontos de amostra (em coordenadas mundiais):
Eu tenho que calcular e plotar os pontos nas coordenadas da câmera e nas coordenadas da imagem, então escrevi o seguinte código no Octave:
%camera intrinsic parameters
f = 16
Sx = 0.01
Sy = 0.01
Ox = 320
Oy = 240
%given points, in world coordinate
wP1 = transpose([1, 1, 0.5])
wP2 = transpose([1, 1.5, 0.5])
wP3 = transpose([1.5, 1.5, 0.5])
wP4 = transpose([1.5, 1, 0.5])
% camera translation matrix
wTc = transpose([-1, 1, 5])
% rotation angle converted to rad
theta = 160 / 180 * pi
%camera rotation matrix
wRc = transpose([cos(theta), 0, sin(theta); 0, 1, 0; -sin(theta), 0, cos(theta)])
%transform the points to homogeneous coordinates
wP1h = [wP1; 1]
wP2h = [wP2; 1]
wP3h = [wP3; 1]
wP4h = [wP4; 1]
%separate each line of the rotation matrix
R1 = transpose(wRc(1 , :))
R2 = transpose(wRc(2 , :))
R3 = transpose(wRc(3 , :))
%generate the extrinsic parameters matrix
Mext = [wRc, [-transpose(R1) * wTc; -transpose(R2) * wTc; -transpose(R3) * wTc]]
%intrinsic parameters matrix
Mint = [-f/Sx, 0, Ox; 0, -f/Sy, Oy; 0, 0, 1]
% calculate coordinates in camera coordinates
cP1 = wRc * (wP1 - wTc)
cP2 = wRc * (wP2 - wTc)
cP3 = wRc * (wP3 - wTc)
cP4 = wRc * (wP4 - wTc)
% put coordinates in a list for plotting
x = [cP1(1), cP2(1), cP3(1), cP4(1), cP1(1)]
y = [cP1(2), cP2(2), cP3(2), cP4(2), cP1(2)]
z = [cP1(3), cP2(3), cP3(3), cP4(3), cP1(3)]
%plot the points in 3D using camera coordinates
plot3(x, y, z, "o-r")
pause()
% calculate the points in image coordinates
iP1 = Mint * (Mext * wP1h)
iP2 = Mint * (Mext * wP2h)
iP3 = Mint * (Mext * wP3h)
iP4 = Mint * (Mext * wP4h)
%generate a list of points for plotting
x = [iP1(1) / iP1(3), iP2(1) / iP2(3), iP3(1) / iP3(3), iP4(1) / iP4(3), iP1(1) / iP1(3)]
y = [iP1(2) / iP1(3), iP2(2) / iP2(3), iP3(2) / iP3(3), iP4(2) / iP4(3), iP1(2) / iP1(3)]
plot(x, y, "o-r")
pause()
E estas são as tramas que recebi do roteiro: esperava que elas fossem um pouco parecidas, mas não parecem.
Plotar coordenadas da câmera
Plotar nas coordenadas da imagem
fonte
Respostas:
Identificar seus eixos nas duas figuras e adicionar a posição da câmera à sua primeira figura ajudará você a entender o que está acontecendo.
Uma boa maneira de verificar sua resposta é usando um modelador 3D existente como o Blender: tenha cuidado com o sistema de coordenadas do Blender, por exemplo, o vetor padrão da câmera é
[0, 0, -1]
. Aqui está a renderização: Focal foi definido com outro valor para tornar a esfera mais visível. Portanto, vemos que os dois pontos inferiores estão na linha do meio da imagem e os pontos estão ligeiramente à direita da imagem.Eu implementei sua lição de casa em Python:
Isso me dá as seguintes figuras: Respectivamente: coordenadas mundiais, coordenadas da câmera, coordenadas da câmera giradas para se ajustar levemente à orientação da câmera (observe que aqui o vetor da câmera vai em direção ao ponto de vista da figura, ele não "entra" na figura) e nas coordenadas da imagem.
Portanto, vemos que as coordenadas verticais para os pontos inferiores estão corretamente na linha do meio (240) e os pontos estão no lado direito da imagem (valor horizontal> 320).
-f/Sxy
fonte