作業記録2023古市
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
**メモ [#a86aff7a]
-[[作業記録2021古市]]
-[[作業記録2022古市]]
-VAI2.5ユーザーガイドhttps://docs.xilinx.com/r/2.5-%E6%97...
-DPUCZDX8Gガイドhttps://docs.xilinx.com/r/ja-JP/pg338-dpu...
-VAI2.5コンパイル参考https://misoji-engineer.com/archives...
-VOCmAPとCOCOmAPの違いhttps://qiita.com/tmtakashi_dist/it...
-VAI2.5におけるCustomOPの登録方法https://github.com/Xilin...
-v4-tinyとv7-tinyの速度https://github.com/WongKinYiu/yolo...
-aarch64向けpytorchビルド関連
--https://github.com/pytorch/pytorch/issues/23233
--https://github.com/nmilosev/pytorch-arm-builds/blob/mas...
--https://wlog.flatlib.jp/category/cat29/
-ボード上でのビルドに時間がかかりすぎる問題https://nmilos...
**参考にできるかもしれない論文 [#lb575bd7]
-エッジのリアルタイム物体検出と光学式リモート センシング...
-単一クラスの物体検出カスタムlittlenetのverilog,FINN,Viti...
-チャネルプルーニングに基づく衛星リモートセンシング画像物...
-Vitis AI を使用した畳み込みニューラル ネットワークの実装...
-CNN とその FPGA 実装に基づくターゲット検出アルゴリズムht...
*作業記録 [#e3ff6da6]
**12/15 [#f0ca3837]
-コードがだいたいC++になった
-torchvisionのnmsが使いたかったので、公式リポジトリに則り...
--CmakeList.txt内にlist(APPEND CMAKE_PREFIX_PATH /usr/inc...
-gccのオプションに-I/usr/local/include/torchvision,-L/usr...
**12/11 [#n5e9201f]
-https://github.com/pytorch/pytorch/issues/31822これみた...
#include <torch/include/c10/util/logging_is_not_google_g...
#undef GLOG
#undef CHECK
-これ書いて、未定義エラー出たところはログファイル見に行っ...
**12/10 [#x56b918b]
-torch/libがリンクされていなかった
-LD_LIBRARY_PATHを.bashrcに追加してもうまくいかなかった
-https://qiita.com/Esfahan/items/0064d845ca6faf7f3d47を参...
**12/8 [#tc86c6a1]
-コンパイルはできるのに、実行でエラー
-libc10とpytorch_cpuがリンクされない
ImportError: libc10.so: cannot open shared object file:...
**12/7 [#t211b152]
-PMbusの監視から消費電力を測定した
--静的電力 ピーク 5.5W 600sの平均 5.35W
--推論実行中の動的電力 ピーク 8.1W 660秒の平均 5.40W
-include<torch/torch.h>できない問題解決
cflags = "-I/usr/include/torch/include/torch/csrc/api/in...
I/usr/include/torch/include/"
ldflags = "-L/usr/include/torch/lib -lc10 -ltorch_cpu"
**12/4 [#ifeab8c8]
-C++pytorchをソースからビルドできたが、pybind11でinclude...
-C++で書いたサンプルは動く
**12/1 [#k1c480db]
-Ultra96はPMBusを利用して電圧を読み取ることはできる?
-推論コードを動かす裏で別のノートブックで計測する
--https://discuss.pynq.io/t/best-way-to-monitor-power-con...
**11/29 [#d51ad4e5]
-DPUのコアを2つにして、プラットフォームのビルド、コンパイ...
-推論で1つのコアだけ使用しているっぽい
**11/24 [#odbd632d]
-Eigenを使ったテンソルの扱いに苦戦
--デフォルトではサポートされておらず、無理やり感のある実装
--可能ならpytorchをすぐに使いたい
**11/23 [#o11e991c]
-pytorchをソースからビルドするのにとてつもない時間がかかる
-sshが切れる、ボードがハングアップ?
-一旦後回し
**11/20 [#w06a39c2]
-pytorchのC++APIをaarch64で使用するにはソースからビルドす...
-libtorchの公式手順通りではmakeでエラー
**11/19 [#b4b864cc]
-pytorchCPU版を使用して、python版の後処理が160sほど速くな...
-pythonでjpg読み込む場合はlycon https://github.com/ethere...
**11/18 [#oe1d532e]
-後処理部分のDPU出力の整形、シグモイド関数による正規化の...
-C++のEigenが行列計算に特化したライブラリでそれを使用中
-テンソルには非対応なので、PytorchのCPU版をインストールで...
-pybind11ではなく、全コードをC++化する
**11/10 [#r0b46f20]
-前処理後のcv::Matの画像をDPU入力用のvectorに代入している...
-チャネル、ピクセル値ごとの代入で解決したが、速度は不明
**11/5 [#ge1f7163]
-消費電力
--静的 12V*0.28~0.30A=3.36~4.8W
--動的 12V*0.42A=5.04W
-ファン交換したら前処理の時間が遅くなった?200s→223s
**11/4 [#y3378ed3]
-読んだhttps://ieeexplore.ieee.org/abstract/document/1012...
-YOLOv4とResNetをZCU104にVitisAIで実装
-チュートリアルをそのまま動かして、ビット幅変更やプロファ...
-VitisAIでの実装は汎用的であるため、ハードウェアリソース...
-RTL/HLSとは違い、実装期間の短さ、専門家でなくても設計可...
-関連研究も踏まえ、ソフトウェアがスループットのボトルネッ...
**10/20 [#le71fea1]
-前処理はC++になった
-DPUのinput,outputの宣言?が不明
-VARTのC++APIのコーディングがわからない
--公式リポジトリのサンプルを見てもいまいち
**10/5 [#y226ba31]
-カーネル落ちるのはメモリではなく、普通にコードの問題?だ...
-ファイル名取得解決
**10/4 [#n5f412ad]
-指定したパス下のファイル名を取得し、vectorstring型のimag...
-C++17で使える標準ライブラリのfilesystemを使用
-画像枚数に関わらず、カーネルが強制終了する
-コンパイルエラーは無し
**9/30 [#x7d29d59]
-pybind11でC++に書き換え中
-テスト画像のリスト化でメモリ不足?
**9/18 [#s857f6ff]
-使用ハードウェアリソース
-コンフィグ
|DPU|B1600orB2304|
|ULAM|DISABLE|
|RAM_USAGE|LOW|
|CHANNEL_AUGMENTATION|DISABLE|
|ALU_PARALLEL|DEFAULT|
|CONV_RELU|LEAKYRELU_RELU6|
|ALU_RELU|RELU6|
|DSP48_USAGE|LOW|
|LOWPOWER|DISABLE|
-使用リソース
||B1600|B2304|Available|B1600Util%|B2304Util%|
|LUT|38092|43193|70560|53.99|61.21|
|FF|63146|74437|141120|44.75|52.75|
|BRAM|126|165|216|58.33|76.39|
|DSP|246|342|360|68.33|95.00|
**8/18 [#h230863a]
-VitisAIプロファイラーを使って、解析したいがPYNQ+DPUの環...
--全く同じエラーのissue未解決https://github.com/Xilinx/DP...
**7/28 [#h857b27d]
-精度測定を行った
FPGA動作モデル
Average Precision (AP) @[ IoU=0.50:0.95 | area= all |...
Average Precision (AP) @[ IoU=0.50 | area= all |...
Average Precision (AP) @[ IoU=0.75 | area= all |...
元モデル(Pytorch)
Average Precision (AP) @[ IoU=0.50:0.95 | area= all |...
Average Precision (AP) @[ IoU=0.50 | area= all |...
Average Precision (AP) @[ IoU=0.75 | area= all |...
**7/27 [#t5740886]
-特徴マップからバウンディングボックスのxywhを抽出する演算...
-複数のボックスが予測されていたのは、NMSより前の特徴マッ...
**7/7 [#z3939607]
-評価用コードを書く
-MSCOCOはAPIが提供されているのでそれに従う
-MSCOCOは元は91クラスにするつもりだったが、11クラス削除さ...
-val5000枚のうち、48枚には物体は存在せず背景のみ
**7/3 [#x590d0e7]
-後処理のコードを改善し、少し速くなった
--3.9FPS→4.9FPS
-yolov4-tinyも同様に動作させた
--5000枚、評価有り 421s 11.7FPS、評価無し 362s 13.6FPS
**6/8 [#s5a05fe5]
-卒論のときの自分で調整したv4-tinyのxmodelファイルを見つ...
-xmodelファイルのロード、input,outputノードの読み込みはで...
-現状
--非常に低速でYOLOv7-tinyが動作
---実行時間のうち、後処理が占める時間が大きい
--検出結果を描画すると一つの物体に対して、複数のボックス...
---複数スケールの結果それぞれ別々にnmsを適用しているため?
---yolov5,v7ともにtorchvisionのnmsを使用、クラスごとに計...
--yolov7元モデルでは、推論時に検出層で特徴マップからシグ...
--現在は検出層の部分をDPUに載せられないので、検出層前の特...
**6/5 [#oc740ee1]
-YOLOv7-tinyが動作した
-推論結果の後処理が上手くいっていないのか、複数のボックス...
**5/31 [#n9461c99]
-卒研のときと同じフローでdarknet→keras→tfに変換して、量子...
-netronでコンパイルで出力されたxmodelを確認したが問題無さ...
-v4-tinyに存在したsplit層が無いので、元モデルの変更無しで...
-検出層にsigmoidがあるのでそれはCPU割り当て
**5/29 [#id2dc105]
-検出層におけるシグモイド、予測ボックスの座標やサイズ計算...
-v4-tinyと同様に.weights→keras→tfかonnx→tfを試したほうが...
**5/26 [#ffa9d3aa]
-コンパイルしたモデルをnetronで確認すると、検出層からCPU...
-警告の出た演算以外もCPU割り当て、複雑になっていてよくわ...
-darknet実装(yolov7-tiny.cfg),onnx形式とも比較したが、検...
**5/25 [#ud04fecb]
-エラーが出ていた演算をcustomOPとして記述して、一応量子化...
-他の演算でも警告が出てるので対応いりそう
-前提を与えてGPTにコーディングさせると捗る
**5/24 [#h28b151f]
-customOPのコードを書いてる
**5/19 [#ae03c87a]
-一部のサポートさていない演算のせいでコンパイルできない問...
-サポートさていない演算をCustomOPとして登録する必要がある
-類似の質問https://github.com/Xilinx/Vitis-AI/issues/811
-VitisAIのissueやyolov5での例を探してみる
**5/18 [#pe875d28]
-読んだhttps://ieeexplore.ieee.org/abstract/document/1001...
-FINN,VitisAI,JetsonNano,IntelCPUの比較
-FINNは対応モデル・ボードが少ないので拡張して同条件で比較
-FINNがスループット、電力効率などどの面でも優れている
-FINNはデータフロー型、VitisAIはオーバーレイ型
--FINNはモデルサイズが大きいとオンチップに保存できない
--VitisAIはDRAMアクセスがボトルネックとなり、ピーク性能が...
--DRAM帯域幅の差が縮まれば、FINNとVitisAIの差は縮まる
-FPGAが大きければFINNが有利、小さければVitisAIが有利
-量子化コードはモデルの評価を無理やり飛ばして、コンパイル...
-サポートされてない?演算を解決できない
-customOPについての参考文献が少なくてよくわからない
WARNING: Logging before InitGoogleLogging() is written t...
W0518 00:11:42.094635 324 tool_function.cpp:171] [UNIL...
operator named Model__Model_Detect_model__Detect_77__878...
defined in XIR. XIR creates the definition of this opera...
should specify the shape and the data_type of the output...
operation by set_attr("shape", std::vector<int>) and set...
std::string)
W0518 00:11:42.095167 324 tool_function.cpp:171] [UNIL...
operator named Model__Model_Detect_model__Detect_77__879...
aten::meshgrid, is not defined in XIR. XIR creates the d...
operator automatically. You should specify the shape and...
output tensor of this operation by set_attr("shape", std...
set_attr("data_type", std::string)
F0518 00:11:42.095486 324 wrapper.cpp:111] [UNILOG][FA...
*** Check failure stack trace: ***
Aborted (core dumped)
**5/15 [#xc5c0172]
-モデル評価のためにリサイズした画像を用意する
-長辺が640になるように正方形にリサイズ
-中央に配置し、余りはグレーでパディング
-cv2.imwriteで画像が保存されていない、エラーは無し
**5/8 [#s3026b0f]
-チュートリアルのquantize.py,common.pyとyolov7のyolo.pyを...
**4/28 [#k9f6cb87]
-quantize.pyを動かすのにcommon.pyが必要
-少しいじった
-エラーログ
Traceback (most recent call last):
File "quantize.py", line 108, in <module>
run_main()
File "quantize.py", line 101, in run_main
quantize(args.model_name,args.quant_mode,args.batchsi...
File "quantize.py", line 49, in quantize
model.load_state_dict(torch.load(os.path.join(data_pa...
File "/opt/vitis_ai/conda/envs/vitis-ai-pytorch/lib/pyt...
return _load(opened_zipfile, map_location, pickle_mod...
File "/opt/vitis_ai/conda/envs/vitis-ai-pytorch/lib/pyt...
result = unpickler.load()
File "/opt/vitis_ai/conda/envs/vitis-ai-pytorch/lib/pyt...
return super().find_class(mod_name, name)
ModuleNotFoundError: No module named 'models'
**4/20 [#rae8ddaf]
-YOLOv7-tinyをVitisAI2.5で量子化・コンパイルしたい
-YOLOv7はPytorch実装
-VitisAI2.5のチュートリアルにある量子化に使うquantize.py...
**4/16 [#zbb58185]
-MobaXtermでSSHトンネルの設定を行い、自宅からボード上のju...
--
**4/5 [#u8cd64a3]
-作業記録作成
-PYNQver3.0.1が登場していたので、それにアップデートした
-Ultra96-PYNQ,DPU-PYNQの初期設定を行った
-/etc/wpa_supplicant.confと/etc/network/interfaces.dを編...
終了行:
**メモ [#a86aff7a]
-[[作業記録2021古市]]
-[[作業記録2022古市]]
-VAI2.5ユーザーガイドhttps://docs.xilinx.com/r/2.5-%E6%97...
-DPUCZDX8Gガイドhttps://docs.xilinx.com/r/ja-JP/pg338-dpu...
-VAI2.5コンパイル参考https://misoji-engineer.com/archives...
-VOCmAPとCOCOmAPの違いhttps://qiita.com/tmtakashi_dist/it...
-VAI2.5におけるCustomOPの登録方法https://github.com/Xilin...
-v4-tinyとv7-tinyの速度https://github.com/WongKinYiu/yolo...
-aarch64向けpytorchビルド関連
--https://github.com/pytorch/pytorch/issues/23233
--https://github.com/nmilosev/pytorch-arm-builds/blob/mas...
--https://wlog.flatlib.jp/category/cat29/
-ボード上でのビルドに時間がかかりすぎる問題https://nmilos...
**参考にできるかもしれない論文 [#lb575bd7]
-エッジのリアルタイム物体検出と光学式リモート センシング...
-単一クラスの物体検出カスタムlittlenetのverilog,FINN,Viti...
-チャネルプルーニングに基づく衛星リモートセンシング画像物...
-Vitis AI を使用した畳み込みニューラル ネットワークの実装...
-CNN とその FPGA 実装に基づくターゲット検出アルゴリズムht...
*作業記録 [#e3ff6da6]
**12/15 [#f0ca3837]
-コードがだいたいC++になった
-torchvisionのnmsが使いたかったので、公式リポジトリに則り...
--CmakeList.txt内にlist(APPEND CMAKE_PREFIX_PATH /usr/inc...
-gccのオプションに-I/usr/local/include/torchvision,-L/usr...
**12/11 [#n5e9201f]
-https://github.com/pytorch/pytorch/issues/31822これみた...
#include <torch/include/c10/util/logging_is_not_google_g...
#undef GLOG
#undef CHECK
-これ書いて、未定義エラー出たところはログファイル見に行っ...
**12/10 [#x56b918b]
-torch/libがリンクされていなかった
-LD_LIBRARY_PATHを.bashrcに追加してもうまくいかなかった
-https://qiita.com/Esfahan/items/0064d845ca6faf7f3d47を参...
**12/8 [#tc86c6a1]
-コンパイルはできるのに、実行でエラー
-libc10とpytorch_cpuがリンクされない
ImportError: libc10.so: cannot open shared object file:...
**12/7 [#t211b152]
-PMbusの監視から消費電力を測定した
--静的電力 ピーク 5.5W 600sの平均 5.35W
--推論実行中の動的電力 ピーク 8.1W 660秒の平均 5.40W
-include<torch/torch.h>できない問題解決
cflags = "-I/usr/include/torch/include/torch/csrc/api/in...
I/usr/include/torch/include/"
ldflags = "-L/usr/include/torch/lib -lc10 -ltorch_cpu"
**12/4 [#ifeab8c8]
-C++pytorchをソースからビルドできたが、pybind11でinclude...
-C++で書いたサンプルは動く
**12/1 [#k1c480db]
-Ultra96はPMBusを利用して電圧を読み取ることはできる?
-推論コードを動かす裏で別のノートブックで計測する
--https://discuss.pynq.io/t/best-way-to-monitor-power-con...
**11/29 [#d51ad4e5]
-DPUのコアを2つにして、プラットフォームのビルド、コンパイ...
-推論で1つのコアだけ使用しているっぽい
**11/24 [#odbd632d]
-Eigenを使ったテンソルの扱いに苦戦
--デフォルトではサポートされておらず、無理やり感のある実装
--可能ならpytorchをすぐに使いたい
**11/23 [#o11e991c]
-pytorchをソースからビルドするのにとてつもない時間がかかる
-sshが切れる、ボードがハングアップ?
-一旦後回し
**11/20 [#w06a39c2]
-pytorchのC++APIをaarch64で使用するにはソースからビルドす...
-libtorchの公式手順通りではmakeでエラー
**11/19 [#b4b864cc]
-pytorchCPU版を使用して、python版の後処理が160sほど速くな...
-pythonでjpg読み込む場合はlycon https://github.com/ethere...
**11/18 [#oe1d532e]
-後処理部分のDPU出力の整形、シグモイド関数による正規化の...
-C++のEigenが行列計算に特化したライブラリでそれを使用中
-テンソルには非対応なので、PytorchのCPU版をインストールで...
-pybind11ではなく、全コードをC++化する
**11/10 [#r0b46f20]
-前処理後のcv::Matの画像をDPU入力用のvectorに代入している...
-チャネル、ピクセル値ごとの代入で解決したが、速度は不明
**11/5 [#ge1f7163]
-消費電力
--静的 12V*0.28~0.30A=3.36~4.8W
--動的 12V*0.42A=5.04W
-ファン交換したら前処理の時間が遅くなった?200s→223s
**11/4 [#y3378ed3]
-読んだhttps://ieeexplore.ieee.org/abstract/document/1012...
-YOLOv4とResNetをZCU104にVitisAIで実装
-チュートリアルをそのまま動かして、ビット幅変更やプロファ...
-VitisAIでの実装は汎用的であるため、ハードウェアリソース...
-RTL/HLSとは違い、実装期間の短さ、専門家でなくても設計可...
-関連研究も踏まえ、ソフトウェアがスループットのボトルネッ...
**10/20 [#le71fea1]
-前処理はC++になった
-DPUのinput,outputの宣言?が不明
-VARTのC++APIのコーディングがわからない
--公式リポジトリのサンプルを見てもいまいち
**10/5 [#y226ba31]
-カーネル落ちるのはメモリではなく、普通にコードの問題?だ...
-ファイル名取得解決
**10/4 [#n5f412ad]
-指定したパス下のファイル名を取得し、vectorstring型のimag...
-C++17で使える標準ライブラリのfilesystemを使用
-画像枚数に関わらず、カーネルが強制終了する
-コンパイルエラーは無し
**9/30 [#x7d29d59]
-pybind11でC++に書き換え中
-テスト画像のリスト化でメモリ不足?
**9/18 [#s857f6ff]
-使用ハードウェアリソース
-コンフィグ
|DPU|B1600orB2304|
|ULAM|DISABLE|
|RAM_USAGE|LOW|
|CHANNEL_AUGMENTATION|DISABLE|
|ALU_PARALLEL|DEFAULT|
|CONV_RELU|LEAKYRELU_RELU6|
|ALU_RELU|RELU6|
|DSP48_USAGE|LOW|
|LOWPOWER|DISABLE|
-使用リソース
||B1600|B2304|Available|B1600Util%|B2304Util%|
|LUT|38092|43193|70560|53.99|61.21|
|FF|63146|74437|141120|44.75|52.75|
|BRAM|126|165|216|58.33|76.39|
|DSP|246|342|360|68.33|95.00|
**8/18 [#h230863a]
-VitisAIプロファイラーを使って、解析したいがPYNQ+DPUの環...
--全く同じエラーのissue未解決https://github.com/Xilinx/DP...
**7/28 [#h857b27d]
-精度測定を行った
FPGA動作モデル
Average Precision (AP) @[ IoU=0.50:0.95 | area= all |...
Average Precision (AP) @[ IoU=0.50 | area= all |...
Average Precision (AP) @[ IoU=0.75 | area= all |...
元モデル(Pytorch)
Average Precision (AP) @[ IoU=0.50:0.95 | area= all |...
Average Precision (AP) @[ IoU=0.50 | area= all |...
Average Precision (AP) @[ IoU=0.75 | area= all |...
**7/27 [#t5740886]
-特徴マップからバウンディングボックスのxywhを抽出する演算...
-複数のボックスが予測されていたのは、NMSより前の特徴マッ...
**7/7 [#z3939607]
-評価用コードを書く
-MSCOCOはAPIが提供されているのでそれに従う
-MSCOCOは元は91クラスにするつもりだったが、11クラス削除さ...
-val5000枚のうち、48枚には物体は存在せず背景のみ
**7/3 [#x590d0e7]
-後処理のコードを改善し、少し速くなった
--3.9FPS→4.9FPS
-yolov4-tinyも同様に動作させた
--5000枚、評価有り 421s 11.7FPS、評価無し 362s 13.6FPS
**6/8 [#s5a05fe5]
-卒論のときの自分で調整したv4-tinyのxmodelファイルを見つ...
-xmodelファイルのロード、input,outputノードの読み込みはで...
-現状
--非常に低速でYOLOv7-tinyが動作
---実行時間のうち、後処理が占める時間が大きい
--検出結果を描画すると一つの物体に対して、複数のボックス...
---複数スケールの結果それぞれ別々にnmsを適用しているため?
---yolov5,v7ともにtorchvisionのnmsを使用、クラスごとに計...
--yolov7元モデルでは、推論時に検出層で特徴マップからシグ...
--現在は検出層の部分をDPUに載せられないので、検出層前の特...
**6/5 [#oc740ee1]
-YOLOv7-tinyが動作した
-推論結果の後処理が上手くいっていないのか、複数のボックス...
**5/31 [#n9461c99]
-卒研のときと同じフローでdarknet→keras→tfに変換して、量子...
-netronでコンパイルで出力されたxmodelを確認したが問題無さ...
-v4-tinyに存在したsplit層が無いので、元モデルの変更無しで...
-検出層にsigmoidがあるのでそれはCPU割り当て
**5/29 [#id2dc105]
-検出層におけるシグモイド、予測ボックスの座標やサイズ計算...
-v4-tinyと同様に.weights→keras→tfかonnx→tfを試したほうが...
**5/26 [#ffa9d3aa]
-コンパイルしたモデルをnetronで確認すると、検出層からCPU...
-警告の出た演算以外もCPU割り当て、複雑になっていてよくわ...
-darknet実装(yolov7-tiny.cfg),onnx形式とも比較したが、検...
**5/25 [#ud04fecb]
-エラーが出ていた演算をcustomOPとして記述して、一応量子化...
-他の演算でも警告が出てるので対応いりそう
-前提を与えてGPTにコーディングさせると捗る
**5/24 [#h28b151f]
-customOPのコードを書いてる
**5/19 [#ae03c87a]
-一部のサポートさていない演算のせいでコンパイルできない問...
-サポートさていない演算をCustomOPとして登録する必要がある
-類似の質問https://github.com/Xilinx/Vitis-AI/issues/811
-VitisAIのissueやyolov5での例を探してみる
**5/18 [#pe875d28]
-読んだhttps://ieeexplore.ieee.org/abstract/document/1001...
-FINN,VitisAI,JetsonNano,IntelCPUの比較
-FINNは対応モデル・ボードが少ないので拡張して同条件で比較
-FINNがスループット、電力効率などどの面でも優れている
-FINNはデータフロー型、VitisAIはオーバーレイ型
--FINNはモデルサイズが大きいとオンチップに保存できない
--VitisAIはDRAMアクセスがボトルネックとなり、ピーク性能が...
--DRAM帯域幅の差が縮まれば、FINNとVitisAIの差は縮まる
-FPGAが大きければFINNが有利、小さければVitisAIが有利
-量子化コードはモデルの評価を無理やり飛ばして、コンパイル...
-サポートされてない?演算を解決できない
-customOPについての参考文献が少なくてよくわからない
WARNING: Logging before InitGoogleLogging() is written t...
W0518 00:11:42.094635 324 tool_function.cpp:171] [UNIL...
operator named Model__Model_Detect_model__Detect_77__878...
defined in XIR. XIR creates the definition of this opera...
should specify the shape and the data_type of the output...
operation by set_attr("shape", std::vector<int>) and set...
std::string)
W0518 00:11:42.095167 324 tool_function.cpp:171] [UNIL...
operator named Model__Model_Detect_model__Detect_77__879...
aten::meshgrid, is not defined in XIR. XIR creates the d...
operator automatically. You should specify the shape and...
output tensor of this operation by set_attr("shape", std...
set_attr("data_type", std::string)
F0518 00:11:42.095486 324 wrapper.cpp:111] [UNILOG][FA...
*** Check failure stack trace: ***
Aborted (core dumped)
**5/15 [#xc5c0172]
-モデル評価のためにリサイズした画像を用意する
-長辺が640になるように正方形にリサイズ
-中央に配置し、余りはグレーでパディング
-cv2.imwriteで画像が保存されていない、エラーは無し
**5/8 [#s3026b0f]
-チュートリアルのquantize.py,common.pyとyolov7のyolo.pyを...
**4/28 [#k9f6cb87]
-quantize.pyを動かすのにcommon.pyが必要
-少しいじった
-エラーログ
Traceback (most recent call last):
File "quantize.py", line 108, in <module>
run_main()
File "quantize.py", line 101, in run_main
quantize(args.model_name,args.quant_mode,args.batchsi...
File "quantize.py", line 49, in quantize
model.load_state_dict(torch.load(os.path.join(data_pa...
File "/opt/vitis_ai/conda/envs/vitis-ai-pytorch/lib/pyt...
return _load(opened_zipfile, map_location, pickle_mod...
File "/opt/vitis_ai/conda/envs/vitis-ai-pytorch/lib/pyt...
result = unpickler.load()
File "/opt/vitis_ai/conda/envs/vitis-ai-pytorch/lib/pyt...
return super().find_class(mod_name, name)
ModuleNotFoundError: No module named 'models'
**4/20 [#rae8ddaf]
-YOLOv7-tinyをVitisAI2.5で量子化・コンパイルしたい
-YOLOv7はPytorch実装
-VitisAI2.5のチュートリアルにある量子化に使うquantize.py...
**4/16 [#zbb58185]
-MobaXtermでSSHトンネルの設定を行い、自宅からボード上のju...
--
**4/5 [#u8cd64a3]
-作業記録作成
-PYNQver3.0.1が登場していたので、それにアップデートした
-Ultra96-PYNQ,DPU-PYNQの初期設定を行った
-/etc/wpa_supplicant.confと/etc/network/interfaces.dを編...
ページ名: