728x90
반응형

인턴 11

[Doubango/ultimateALPR/Docs] Improving the accuracy 번역

정확도 향상 Github에서 제공하는 코드는 모두가 거의 만족할 만한 기본 옵션과 함께 제공됩니다. 사용 사례에 맞게 정확도를 높이고 싶을 수 있습니다. Detector 이 섹션에서는 detection 계층의 정확도를 높이는 방법에 대해 설명합니다. 멀리 떨어져 있거나 매우 작은 번호판 이 섹션에서는 매우 작거나 멀리 떨어진 플레이트에서 정확도를 향상시키는 방법을 설명합니다. 관심 영역(Region of Interest) 이전 섹션에서 설명한 대로 감지기는 300x300 이미지를 입력으로 예상합니다. 입력 크기에 관계없이 감지기는 항상 300x300으로 축소하고 RGB_888로 변환합니다. 번호판이 멀리 있거나 매우 작고 이미지가 너무 큰 경우 300x300으로 축소하면 이러한 번호판이 거의 사라집니다...

[Anaconda] Conda란?(Feat. Conda 설치하기, Conda 기본 명령어)

콘다(Anaconda or Conda)란? 콘다란 언어의 패키지, 의존관계, 환경을 관리하는 가상환경 도구입니다. 파이썬의 경우 2.x부터 시작해서 패키지의 버전에 따라 의존성이 강하기 때문에 콘다와 같은 가상환경을 이용하여 패키지를 관리하면 편합니다. Conda는 쉽게 이야기하면 가상환경을 만들어주는 도구입니다. 그리고 Conda의 가상환경을 만들면서 tensorflow, pandas와 같은 패키지를 다운받는다면, 기본 환경은 건들지 않으면서 conda 환경안에서 tensorflow, pandas를 사용할 수 있다. Conda 다운로드 wget을 이용해 자신이 원하는 conda 파일을 다운받습니다. 저는 miniconda를 다운받도록 하겠습니다. bash명령어를 이용해 자신이 다운로드 받은 conda파..

인턴 2021.08.21

[TVM] TVM 설치하기(feat. Anaconda 이용)

이번에는 TVM을 설치하는 것을 알아보도록 하겠습니다. 서버에서 tvm다운받으려고 엄청나게 고생했습니다... 제 환경은 Ubuntu 18.04 입니다. TVM을 설치하기 위해서는 LLVM과 cmake를 미리 설치하는것이 필요합니다. LLVM 설치는 제 포스팅을 보고 따라하시기 바랍니다. 2021.07.11 - [인턴] - [컴파일러] LLVM 다운로드 및 설치 방법 [컴파일러] LLVM 다운로드 및 설치 방법 이번 글에는 llvm을 사용하기 위해 pre-built binary 파일을 다운 받는 과정을 작성해보도록 하겠다. 설치환경 : Ubuntu 16.04에 LLVM 6.0.1을 다운받았다. 먼저 미리 빌드된 binary 파일을 사용하기 위해서 아 roadtosuccess.tistory.com 먼저 자신..

인턴 2021.08.21

[OpenCL] OpenCL 정의와 동작방식(feat. Host program 작성순서)

OpenCL이란?? Open Coumputing Language의 약자로 개방형 병렬컴퓨팅 프레임워크이다. 다시말해, 이종플랫폼에서 동작하는 프로그램을 작성하기 위한 프레임워크이다. 여기서 이종플랫폼이란 CPU, GPU, FPGA 등과 같은 프로세서를 의미한다. OpenCL은 범용 프로세서들에 대해서 쓴다면 CUDA는 GPU에 특화된 프레임 워크라고 할수있다. OpenCL을 잘 배우면 CUDA도 쉽게 배울 수 있다. OpenCL 프로그램 개발 먼저 OpenCL 프레임워크를 사용하기 위해서는 OpenCL을 다운받고 헤더파일을 include 하여 사용할 수 있다. OpenCL로 프로그램을 작성할 때는 디바이스(GPU,CPU 등의 프로세서)에서 동작하는 커널 프로그램과 호스트 프로그램을 따로 작성한다. 커널 ..

인턴 2021.08.17

[Doubango/ultimateALPR/Docs] C++ API header 번역

C++ API 다른 모든 언어의 API는 SWIG를 사용하여 C++ 코드에서 생성됩니다 .이 문서를 기반으로 다른 언어의 API를 사용하는 것은 간단합니다. 유용한 기능이 3개뿐이기 때문입니다. Java를 사용하는 Android용 샘플 코드는 여기에서 찾을 수 있습니다. 설명하는 헤더 파일은 https://github.com/DoubangoTelecom/ultimateALPR-SDK/blob/master/c++/ultimateALPR-SDK-API-PUBLIC.h에 정의되어 있습니다. enum ultimateAlprSdk::ULTALPR_SDK_IMAGE_TYPE​ enum ultimateAlprSdk::ULTALPR_SDK_IMAGE_TYPE​ 이미지 유형을 정의합니다. 값: ULTALPR_SDK_IM..

[DoubangoTelecom/ultimateALPR-SDK/github] recognizer Readme.md 해석

이 응용 프로그램은 개발자가 C ++ API 사용 방법을 보여주는 sample 코드로 사용되며 정확도를 쉽게 확인할 수 있습니다. 이 프로그램은 JPEG / PNG / BMP 파일의 경로를 입력으로 받아들입니다. 이는 API를 사용하는 데 추천할 만한 방법이 아닙니다. 카메라에서 직접 데이터를 읽는 것을 추천합니다. 그리고 파일에 저장하거나 RGB로 변환하지 않고 압축되지 않은 YUV 데이터를 SDK에 공급하는 것이 좋습니다. 이 샘플을 빌드하고 싶지 않고 정확성을 확인하는 빠른 방법을 찾고 있다면 https://www.doubango.org/webapps/alpr/에서 클라우드 기반 솔루션을 사용해보십시오. 이 샘플은 오픈 소스이며 등록 또는 라이선스 키가 필요하지 않습니다. 종속성 SDK는 C ++ ..

[DoubangoTelecom] ultimateALPR SDK - Jetson.md 해석(Jetson과 Jetson_tftrt 차이)

이 문서는 일반적으로 NVIDIA TensorRT에 관한 것이지만 NVIDIA Jetson 장치 (TX1, TX2, Nano, Xavier AGX / NX ...)에 중점을 둡니다. 버전 3.1.0부터 NVIDIA TensorRT 및 TF-TRT를 사용하는 NVIDIA Jetson 장치에 대한 Full GPGPU 가속을 지원합니다. SDK는 NVIDIA의 최신 버전 인 JetPack 4.4.1을 사용하여 테스트되었으며 다른 버전은 지원하지 않습니다. 이 저장소에는 binaries / jetson 및 binaries / jetson_tftrt의 두 가지 바이너리 세트가 있습니다. 시작하기 위에서 설명한 대로 NVIDIA TensorRT와 TF-TRT를 모두 사용합니다. NVIDIA TensorRT는 다음 ..

[Doubango-ultimateALPR-Docs] Parallel versus sequential processing 해석

병렬 처리 VS 순차 처리 ANPR/ALPR Detector는 Convolutional Neural Networks(ConvNet/CNN)을 사용합니다. 입력 레이어의 모양은 높이=300, 너비=300 및 NumBytesPerSample = 3(R, G, B)을 의미하는 [300,300,3]입니다. 모든 이미지는 300x300 고정 해상도로 크기가 조정되고 입력 레이어와 일치하도록 RGB_888(일명 RGB24)로 변환됩니다. 출력 레이어는 더 복잡하고 한 가지 중요한 요소는 이 섹션에서 우리가 관심을 갖는 예측 상자(prediction box)입니다. CNN은 입력에 관계없이 항상 100개의 예측 상자를 출력합니다. 여기에 이러한 상자를 필터링하고 융합하는 역할을 하는 "후처리" 작업이 있습니다. 필터..

[Doubango-ultimateALPR-Docs] Architecture overview 해석

아키텍처 개요 지원되는 운영 체제 우리는 C++11 컴파일러가 있는 모든 OS를 지원합니다. 이 코드는 Android, iOS, Windows, Linux, Raspberry Pi 및 다양한 맞춤형 임베디드 장치(예: 카메라)에서 테스트되었습니다. Github 리포지토리에는 개발자가 구현을 테스트할 수 있도록 참조 코드로 Android, Raspberry Pi, Linux 및 Windows용 바이너리가 포함되어 있습니다. 이 참조 구현은 Java 및 C++ API와 함께 제공됩니다. API는 모든 운영 체제에 공통적이므로 Android, Raspberry Pi, Linux 또는 Windows에서 애플리케이션을 개발하고 테스트할 수 있으며 앞으로 나아갈 준비가 되면 OS용 바이너리를 제공합니다. 지원되는 ..

[Doubango ultimateALPR Docs] Pyramidal search 해석

이전 섹션에서 설명했듯이 detector는 [300, 300, 3] 입력 레이어가 있는 Convolutional Neural Network를 사용합니다. 즉, detection 파이프라인에 표시되는 모든 이미지는 해상도에 관계없이 300x300으로 크기가 조정되고 RGB_888 형식으로 변환됩니다. 저해상도를 사용하면 추론 기능의 속도가 빨라지고 비율 기반 스케일링(ratio-based scaling) 대신 고정 모양(fixed shape)을 사용하면 일반화가 향상되고 훈련 프로세스의 속도가 빨라집니다. 이는(저해상도를 사용했을 때를 가르킴) 이미지가 매우 크고 번호판이 매우 작거나 멀리 있을 때 명백한 이슈(문제점)입니다. 이미지가 2+ 요소로 축소되면 큰 이미지의 작거나 멀리 떨어진 번호판은 사라지는..

인턴 2021.07.16
728x90
반응형