takuroooのブログ

勉強したこととか

DeepLearning

Pythonのurllibを使ってImageNetから画像をダウンロードする

*この記事は以前Qiitaで書いたものです。 qiita.com 概要 PythonでImageNetから画像をダウンロードする方法を解説する記事。 ImageNetの画像をダウンロードする方法は2つある。 一つはImageNet経由で一括ダウンロードする方法と、もう一つはImageNetが管理…

Random Erasingの動きを見てみる

*この記事は以前Qiitaで書いたものです。 qiita.com 目次 目次 概要 Random Erasingとは アルゴリズム アルゴリズムの流れ RandomErasingのパラメータをいじって結果の変化を可視化する 概要 データ拡張の一つであるRandom Erasingの処理を説明する記事 論…

PyTorch 入力画像と教師画像の両方にランダムなデータ拡張を実行する方法

*この記事は以前Qiitaで書いたものです。 qiita.com 目次 目次 概要 セマンティックセグメンテーションとは ランダムなデータ拡張 課題 解決策1 乱数シードを固定する 解決策2 transforms.RandomCrop.get_params(img, output_size))を使う 概要 DeepLearni…

PyTorch transforms/Dataset/DataLoaderの基本動作を確認する

*この記事は以前Qiitaで書いたものです。 qiita.com 目次 目次 概要 この記事の対象読者 前置き PyTorch Tutorial transforms/Dataset/DataLoaderの役割 transforms transformsを実装するのに必要な要件 実装 使い方 Dataset Datasetを実装するのに必要な要…

PyTorchでValidation Datasetを作る方法

*この記事は以前Qiitaで書いたものです。 qiita.com 目次 目次 概要 課題 解決策1 torch.utils.data.Subset 解決策2 torch.utils.data.random_split Chainerのchainer.datasets.split_dataset_randomについて 参考 概要 PyTorchにはあらかじめ有名なデータ…

Kerasを勉強した後にPyTorchを勉強して躓いたこと

*この記事は以前Qiitaで書いたものです。 qiita.com 目次 目次 概要 この記事の対象読者 はじめに Channel First GPUへの転送 CrossEntropyがSoftmax+CrossEntropyになっている CrossEntropyがone-hot-vectorに対応していない 学習と評価を区別する 概要 De…

Random Erasing Data Augmentation

Data augumentation関連の論文メモ 図は論文からの引用 目次 概要 論文リンク 著者 従来の課題 提案手法 アルゴリズム 結果 矩形領域を埋める値 Object Detectionへの適用 自分の実装 概要 入力画像上に所定パラメータに従った矩形領域を生成するRandom Eras…

You Only Look Once: Unified, Real-Time Object Detection(CVPR2016)

ObjectDetection関連の論文メモ 図は論文からの引用 目次 概要 論文リンク 著者 従来の課題 提案手法 ネットワーク構成 検出方法 ロス関数 結果 参考リンク 概要 従来の2stageの物体検出手法とは異なり、バウンディングボックス予測とクラス認識を同時に行い…

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

論文メモ 図は論文からの引用 目次 概要 論文リンク 著者 従来の課題 提案手法 結果 実装 概要 入力画像のサイズによらず、固定サイズの特徴マップを出力するspatial pyramid poolingの提案。 論文リンク https://arxiv.org/pdf/1406.4729.pdf 著者 Kaiming …

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation(ECCV2018)

SemanticSegmention関連の論文メモ 図は論文からの引用 GoogleのDeepLabv3の進化版であるDeepLabv3の論文。 目次 目次 概要 論文リンク 著者 提案手法 DeepLabv3からの変更点 Atrous Spatial Pyramid Pooling 改良版Xception 結果 実装 参考リンク 概要 オブ…

Fully Convolutional Networks for Semantic Segmentation(CVPR2015)

SemanticSegmention関連の論文メモ 図は論文からの引用 目次 目次 概要 論文リンク 著者 提案手法 FCN32s FCN16s FCN8s 結果 実装 参考リンク 自分の実装 PyTorch Keras 概要 クラス分類用の学習済みモデルをfine tuningして全結合層なしモデルを構築しSeman…

U-Net: Convolutional Networks for Biomedical Image Segmentation

SemanticSegmention関連の論文メモ 図は論文からの引用 目次 目次 概要 論文リンク 著者 提案手法 U-Net 結果 実装 動画 メモ 概要 コンテキスト情報を抽出するcontracting pathとアップサンプリングを行うexpansive pathを持ち、contracting pathの特徴マッ…

Pyramid Scene Parsing Network(CVPR2017)

SemanticSegmention関連の論文メモ 図は論文からの引用 目次 目次 概要 論文リンク 著者 従来の課題 解決策 結果 実装 動画 メモ 概要 pyramid pooling moduleを使って異なる大きさの特徴マップを生成、利用することで画像全体と局所的なコンテキスト情報を…