728x90
반응형

인턴/LPR(번호판 인식) 6

[Doubango/ultimateALPR/Docs] Improving the accuracy 번역

정확도 향상 Github에서 제공하는 코드는 모두가 거의 만족할 만한 기본 옵션과 함께 제공됩니다. 사용 사례에 맞게 정확도를 높이고 싶을 수 있습니다. Detector 이 섹션에서는 detection 계층의 정확도를 높이는 방법에 대해 설명합니다. 멀리 떨어져 있거나 매우 작은 번호판 이 섹션에서는 매우 작거나 멀리 떨어진 플레이트에서 정확도를 향상시키는 방법을 설명합니다. 관심 영역(Region of Interest) 이전 섹션에서 설명한 대로 감지기는 300x300 이미지를 입력으로 예상합니다. 입력 크기에 관계없이 감지기는 항상 300x300으로 축소하고 RGB_888로 변환합니다. 번호판이 멀리 있거나 매우 작고 이미지가 너무 큰 경우 300x300으로 축소하면 이러한 번호판이 거의 사라집니다...

[Doubango/ultimateALPR/Docs] C++ API header 번역

C++ API 다른 모든 언어의 API는 SWIG를 사용하여 C++ 코드에서 생성됩니다 .이 문서를 기반으로 다른 언어의 API를 사용하는 것은 간단합니다. 유용한 기능이 3개뿐이기 때문입니다. Java를 사용하는 Android용 샘플 코드는 여기에서 찾을 수 있습니다. 설명하는 헤더 파일은 https://github.com/DoubangoTelecom/ultimateALPR-SDK/blob/master/c++/ultimateALPR-SDK-API-PUBLIC.h에 정의되어 있습니다. enum ultimateAlprSdk::ULTALPR_SDK_IMAGE_TYPE​ enum ultimateAlprSdk::ULTALPR_SDK_IMAGE_TYPE​ 이미지 유형을 정의합니다. 값: ULTALPR_SDK_IM..

[DoubangoTelecom/ultimateALPR-SDK/github] recognizer Readme.md 해석

이 응용 프로그램은 개발자가 C ++ API 사용 방법을 보여주는 sample 코드로 사용되며 정확도를 쉽게 확인할 수 있습니다. 이 프로그램은 JPEG / PNG / BMP 파일의 경로를 입력으로 받아들입니다. 이는 API를 사용하는 데 추천할 만한 방법이 아닙니다. 카메라에서 직접 데이터를 읽는 것을 추천합니다. 그리고 파일에 저장하거나 RGB로 변환하지 않고 압축되지 않은 YUV 데이터를 SDK에 공급하는 것이 좋습니다. 이 샘플을 빌드하고 싶지 않고 정확성을 확인하는 빠른 방법을 찾고 있다면 https://www.doubango.org/webapps/alpr/에서 클라우드 기반 솔루션을 사용해보십시오. 이 샘플은 오픈 소스이며 등록 또는 라이선스 키가 필요하지 않습니다. 종속성 SDK는 C ++ ..

[DoubangoTelecom] ultimateALPR SDK - Jetson.md 해석(Jetson과 Jetson_tftrt 차이)

이 문서는 일반적으로 NVIDIA TensorRT에 관한 것이지만 NVIDIA Jetson 장치 (TX1, TX2, Nano, Xavier AGX / NX ...)에 중점을 둡니다. 버전 3.1.0부터 NVIDIA TensorRT 및 TF-TRT를 사용하는 NVIDIA Jetson 장치에 대한 Full GPGPU 가속을 지원합니다. SDK는 NVIDIA의 최신 버전 인 JetPack 4.4.1을 사용하여 테스트되었으며 다른 버전은 지원하지 않습니다. 이 저장소에는 binaries / jetson 및 binaries / jetson_tftrt의 두 가지 바이너리 세트가 있습니다. 시작하기 위에서 설명한 대로 NVIDIA TensorRT와 TF-TRT를 모두 사용합니다. NVIDIA TensorRT는 다음 ..

[Doubango-ultimateALPR-Docs] Parallel versus sequential processing 해석

병렬 처리 VS 순차 처리 ANPR/ALPR Detector는 Convolutional Neural Networks(ConvNet/CNN)을 사용합니다. 입력 레이어의 모양은 높이=300, 너비=300 및 NumBytesPerSample = 3(R, G, B)을 의미하는 [300,300,3]입니다. 모든 이미지는 300x300 고정 해상도로 크기가 조정되고 입력 레이어와 일치하도록 RGB_888(일명 RGB24)로 변환됩니다. 출력 레이어는 더 복잡하고 한 가지 중요한 요소는 이 섹션에서 우리가 관심을 갖는 예측 상자(prediction box)입니다. CNN은 입력에 관계없이 항상 100개의 예측 상자를 출력합니다. 여기에 이러한 상자를 필터링하고 융합하는 역할을 하는 "후처리" 작업이 있습니다. 필터..

[Doubango-ultimateALPR-Docs] Architecture overview 해석

아키텍처 개요 지원되는 운영 체제 우리는 C++11 컴파일러가 있는 모든 OS를 지원합니다. 이 코드는 Android, iOS, Windows, Linux, Raspberry Pi 및 다양한 맞춤형 임베디드 장치(예: 카메라)에서 테스트되었습니다. Github 리포지토리에는 개발자가 구현을 테스트할 수 있도록 참조 코드로 Android, Raspberry Pi, Linux 및 Windows용 바이너리가 포함되어 있습니다. 이 참조 구현은 Java 및 C++ API와 함께 제공됩니다. API는 모든 운영 체제에 공통적이므로 Android, Raspberry Pi, Linux 또는 Windows에서 애플리케이션을 개발하고 테스트할 수 있으며 앞으로 나아갈 준비가 되면 OS용 바이너리를 제공합니다. 지원되는 ..

728x90
반응형