🧠 AI 10

[논문 리뷰] Object-Based Classification Framework of Remote Sensing Images With Graph Convolutional Networks

Quick Look Authors: Xiaodong Zhang, Member, IEEE, Xiaoliang Tan , Guanzhou Chen , Member, IEEE, Kun Zhu , Puyun Liao, and Tong Wang Date Published : 22 April 2021 Paper Link : https://ieeexplore.ieee.org/document/9411513Tags: Classification, Geoscience Main Takeaway(s): 기존 OBIC 방법들은 각 객체의 개별 특징에만 집중하고, 인접 객체 간의 관계나 정보를 충분히 활용하지 못하는 한계가 있었다. 이를 해결하기 위해 GCN을 도입하여 객체 간의 인접성을 반영한 모델을 제안했으며, 그 결과 기존 ..

[논문 리뷰] Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing

[Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing] Quick Look Authors: [Vadim Titov, Madina Khalmatova, Alexandra Ivanova, Dmitry Vetrov, and Aibek Alanov] Date Published : [9 Sep 2024] Paper Link : [https://arxiv.org/abs/2409.01322]Tags: text-to-image / SD / image generation Main Takeaway(s): 제안된 Guide-and-Rescale 방법은 이미지 편집 시 원본 이미지의 구조와 세부사항을 효과적으로 보존하면서..

[AI Robotics] Configuration Space ( Cspace )

정의로봇 자신과 다른 모든 물체와 로봇의 위치를 지정할 수 있는 데이터 구조 이점플래너가 차원 수를 잘 줄일 수 있다.예시물체가 있는 위치를 잘 표현하려면 6 Dof가 필요하다. 사용자는 기존 프레임에서 (x, y, z) 좌표로 객체의 위치를 지정할 수 있지만 물체도 앞면, 뒷면, 바닥의 3차원으로 되어 있다. 따라서 앞면이 어디를 향하는지, 기울었는지, 똑바로 서있는지, 엎어져있는지를 나타내려면 추가로 3 자유도가 더 필요하다. (이를 오일러 각, 피치, 요, 롤 로 표현) 경로 플래닝에 해당되는 모바일 지상 로봇에 필요한 자유도는 6보다 작다. (로봇과 모든 물체가 바닥에 있으면 높이 좌표(z)를 제거할 수 있다. 하지만 수중로봇이나 공중에 떠 있는 로봇에 경우 z좌표가 필요하다.)이와 마찬가지로 오..

GNN

정의Graph Neural Network노드와 노드 간의 연결성을 나타내는 엣지로 구성된 그래프 데이터에 적합한 학습 알고리즘그래프 구조를 활용해 loss 값을 최소화시키는 것특징유클리디언 공간1차원, 2차원에서 표현 가능이미지와 텍스트, 오디오는 유클리디언 공간상에서 표현할 수 있다.이 데이터들은 거리가 중요하다. (노드-노드로 연결된 격자 형태임으로)반면, 복잡한 연결 관계와 객체 간의 상호 의존성을 그래프로 나타내야 하는 상황이 있다. ( ex. 분자 구조, SNS 데이터 )이들은 연결여부와 연결강도가 중요하다.node, edge, feature로 GNN 그래프가 구성된다. node와 edge의 관계를 인접행렬로 나타내고, feature은 특징 행렬로 나타낸다.

🧠 AI 2024.08.02

LSTM

https://www.youtube.com/watch?v=HXa7Ah87_gM * 위 영상을 보고 정리한 글입니다. 문제시 말씀해 주세요! *LSTM은,- 시계열 데이터를 처리한다. - RNN의 장기의존성 문제 약점을 보완하기 위해 나왔다. => LSTM의 셀 상태 (Cell State, CS)라 불리는 정보가 핵심적 RNN의 약점, 장기의존성 체인룰이 계속해서 늘어남.-> 기울기가 작아짐 -> 학습에 미치는 영향이 미미하다는 뜻 -> 시간적으로 먼 입력값일수록 학습에 미치는 영향이 작아짐ex. don't / underestimate / your / inner / strength을 번역 => 당신의 / 내면의 / 힘을 / 과소평가하지 / 마세요don't와 마세요는 의미적으로 가깝지만, 이러한 관계가 반영..

🧠 AI 2024.07.29

웹 캠 연결

[1] 라이브러리 불러오자. import cv2 as cv import sys [2] 카메라와 연결하자. 1. 웹캠과 연결 시도하고 vv 객체에 저장한다. 2. 첫 번째 인수 웹 캠 번호를 지정한다. 웹캠이 하나면 0으로 지정하자. 3. cv.CAP_DSHOW 는 비디오가 화면에 바로 나타나게 한다. vv = cv.VideoCapture(0,cv.CAP_DSHOW) 여기까지 하면 카메라는 켜지나, 화면에 확인은 안된다. [3] 웹캠과 연결이 실패하면, cap 객체의 isOpened 함수가 false 값을 가진다. => 실패하면 오류 메시지를 출력하고 종료한다. if not vv.isOpened(): sys.exit("카메라 연결 실패") [4] 동영상을 입력하는 행을 무한 반복한다. [5] vv객체의 프..

동영상 출력

동영상 파일 출력 import cv2 cap = cv2.VideoCapture('video.mp4') while cap.isOpened(): #동영상 파일이 올바로 열렸는지? ret,frame = cap.read() # ret : 성공 여부, frame : 받아온 이미지 (프레임) if not ret: print('더 이상 가져올 프레임이 없습니다.') break cv2.imshow('video',frame) if cv2.waitKey(1) == ord('q'): # ord는 아스키코드 값으로 변환하는 함수, print('사용자 입력에 의해 종료합니다.') break cap.release() # 자원 해제 cv2.destroyAllWindows() # 모든 창 닫기 waitKey는 프레임당 대기값이라 이..

이미지 출력

import cv2 img = cv2.imread('img.png') #해당 경로 파일 읽어오기 cv2.imshow('img',img) #img라는 이름 가진 창에 img를 표시 key = cv2.waitKey(5000) #지정된 시간동안 사용자 키 입력 대기 / 0은 무한 대기 / 5000하면 5초 대기 후 자동 꺼짐 print(key) #아스키코드 출력 cv2.destroyAllWindows() #모든창닫기 이미지를 읽는 데는 여러 옵션이 있다. 컬러, 흑백, 투명값까지 포함된(PNG) 컬러 1. cv2.IMREAD_COLOR : 컬러 이미지 ,투명 영역은 무시 (기본값) 2. cv2.IMREAD_GRAYSCALE : 흑백 변환 3. cv2.IMREAD_UNCHANGED : 투명 영역까지 포함 imp..

TypeError: 'numpy._DTypeMeta' object is not subscriptable 오류

https://stackoverflow.com/questions/76879942/how-to-prevent-error-message-when-importing-import-cv2 How to prevent error message when importing import cv2? what does this error mean? I have opencv installed using pip install opencv-python. I’m using Python 3 and am in Jupyter Notebook. import cv2 TypeError: 'numpy._DTypeMeta' object is not subscripta... stackoverflow.com 계속 TypeError: 'numpy._DT..