初心者でもできる!ArmadilloでSoftEtherVPN(Client編)

Armadillo Linux IoT

概要マイコン(Armadillo)でSoftEtherVPNのClientを作成するエッジコンピュータの通信におけるセキュリティを担保する IPを固定できないSIMカードに対して、仮想NICでIPを固定してやることでメンテナンスを楽にする前提条件 root権限で実行してください（…

2020-07-29

線形計画法 + pulp のハンズオン

データサイエンティスト勉強数理最適化データ分析

線形計画法のハンズオンを行いました。機械学習にも使われている技術なのでより深く理解していきたいと思います。

2020-07-27

PyCaretで主成分分析ハンズオン【正規化+可視化(plotly)】メモ

Python データサイエンティストデータ分析予測機械学習

概要 PyCaretでPCAを行いました。（ハイパーパラメータ等の最適化はしていません）とある電力量データでPCAを行いました。ソースコード自前のデータ整形ソースコード（汚い）:13行 import pandas as pd def load_sampledata(): data = pd.read_csv(r'pyca…

2019-05-21

Python_特殊メソッドstr

Python 勉強

概要 datetime.date(2019,5,21)をインスタンス化した後に、print(instance)で文字列が返ってくるのが気になった。コード class testclass: def __init__(self,val1,val2,val3): self.year = val1 self.month = val2 self.day = val3 def __str__(self): pri…

2019-05-17

【備忘録】pythonを使ってftp接続し、最新フォルダを取得する

Python 勉強

概要 ftp接続し、最新フォルダを取得する。覚書 ftplibでftp接続しフォルダにアクセスする。フォルダは自動生成され、フォルダ名称はint型の数値でインクリメントされたものになる。ファイルとフォルダの判断は、.(ピリオド)の有無で行っている。 Code 最…

2019-05-10

RandomForest

勉強 Python 機械学習 scikit-learn

概要ランダムフォレストとは、弱学習器の決定木たくさん使って、単体の決定木より予測精度を向上させましょうというもの回帰でも分類でもどちらでも使用できる弱学習器を重ねる方法は、XGBoostとかLGBMとかもこのアルゴリズムらしい。昔に書いたもの qii…

2019-05-08

ナイーブベイズ（単純ベイズ）

Python 予測勉強自然言語処理

ナイーブベイズ（単純ベイズ）概要自然言語処理によく用いられるらしい分類問題に使用確率に基づいて予測するスパムの除去やカテゴリ分類に利用されるメリット自然言語処理によってそれなりに良い精度をだしてくれるらしい名詞のみで予測できるので…

2019-05-08

コーディングのお勉強 @classmethod

Python 勉強

わからなかったこと Classをインスタンスにするまえに、methodを呼び出せることが理解できなかった。下記のclassでtest.methodtest()としたかった。 class test: def __init__(self): print('初期化') def methodtest(self): print('method_test') return s…

2019-05-07

Ridge回帰とLasso回帰について

Python 予測統計学勉強

読んでる本まだ途中です。見て試してわかる機械学習アルゴリズムの仕組み機械学習図鑑作者: 秋庭伸也,杉山阿聖,寺田学,加藤公一出版社/メーカー: 翔泳社発売日: 2019/04/17メディア: 単行本（ソフトカバー）この商品を含むブログを見るただの線形回帰と…

2019-04-25

テキストマイニング_単語N-gramモデル

ポエムデータサイエンティスト勉強自然言語処理

最近、転職活動の一環の勉強として、「自然言語処理の基本と技術」という本を読んでいます。(データサイエンティストとして、自然言語処理も必要だと考えているため) 前回は、Yahooニュースの本文から形態素解析をjanomeで行った後、名詞をカウントしグラフ…

2019-04-19

テキストマイニング(前回の続き2）

概要前回までのあらすじ入力したURL(yah○○ニュース)から本文を抽出抽出した本文から名詞を抜き出し抜き出した出力はこんなかんじ今回やることグラフ化して、単語の出現頻度を確認するグラフ化はpandasのDataFrameから行う SourceCode # URLを指定し、…

2019-04-17

テキストマイニング（前回の続き）

概要前回までのあらすじここまでできました。今回やることスクレイピングでYah○○ニュースからテキストデータを取得取得したデータを形態素分解 SourceCode BeautifulSoupとurllibをimport 指定したURLからhtmlを取得取得したhtmlから本文を抜き出し、…

2019-04-17

テキストマイニング

Python 勉強テキストマイニング

テキストマイニングとはテキストマイニング（英: text mining）は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報…

2019-04-15

■

Python データ分析

概要 Bokehによるエネルギーデータの可視化 pandasの使い方は下記を参照するとすごく幸せになれます。データ分析で頻出のPandas基本操作 StatsFragments 初心者による「Python初心者がコピペで使える!時系列データの可視化!」でのBokeh分になります。 impor…

2018-07-29

Qiitaの記事が伸びた理由を考えてみた。

データ分析 GoogleAnalytics Qiita

概要初心者による「Python初心者がコピペで使える!時系列データの可視化!」が自分史上かなり伸びたので、やったことないGoogleAnalyticsを導入してみました。 Qiitaの記事をGoogleAnalyticsに登録するのは意外と簡単で、ここを参考にしました。 ↓こんな感じ…

2018-07-26

初心者による「Python初心者がコピペで使える!時系列データの可視化!」

Python データ分析建築設備時系列データ

Qiitaで書きました。 qiita.com 時系列データ分析の可視化僕が普段扱っているデータ（エネルギーデータ）の可視化をPythonを使って行うためのメモです。 Githubにまとめもあげています。エネルギーデータの分析にPythonを使うときの参考になればと思ってい…

2018-07-25

統計検定2級_わからんメモ

勉強統計学

わからないことメモ 2014年度の過去問を解いていく中で、頭に入っていない項目を列挙した。 χ2分布およびその検定 t分布およびその検定(統計量の求め方) クロス集計表（およびその自由度）標準偏差の式確率密度関数偏差値の算出母集団の比率の問題 F分布…

2018-07-05

統計検定2級_第1種の過誤・第2種の過誤

統計学勉強

過誤帰無仮説が正しいのに、対立仮説を正しいとしてしまうことを第1種の過誤対立仮説が正しいのに、帰無仮説を正しいとしてしまうことを第2種の過誤問題集に、一様分布の話がでてきた。有意水準1%で帰無仮説を棄却する対立仮説の下で、過誤が起こる確率…

2018-06-21

統計検定_シンプソンのパラドクス

統計学勉強データ分析

シンプソンのパラドクスえ？シンプソンズがなんだって？「シンプソンのパラドクス」は、データの区切り方によって相関が逆になったりすることらしい。この「シンプソンのパラドクス」は、統計検定2級の問題集でも出てました。 mathtrain.jp 僕の場合、エネ…

2018-06-19

標準化と変動係数の違い

勉強統計学

標準化標準化の目的は、平均と分散を考慮した上で、の数字の「大きさ」を得ることらしい。 mathwords.net 変動係数変動係数は、異なるデータのばらつきを相対的に評価する数値らしい。 bellcurve.jp 異なるデータ同士を評価できるようにデータを変換してい…

2018-06-18

統計検定2級_独立性の検定

統計学勉強

独立性の検定前回と同じ、クロス集計表をにおいて、分類されたデータ群に関連があるか検定すること。適合度検定と同じくχ2分布を使って検定を行う。 bellcurve.jp 上記のURLから見ると、適合度検定とほぼ同じ？感じ？クロス集計表で2行あるほうが独立性の…

2018-06-13

統計検定2級_適合度検定

統計学勉強

適合度検定適合度検定は、χ2分布に従う。らしい。 bellcurve.jp リンク先の例題だと、クロス集計表を使った適合度検定をしているけど、クロス集計表の場合、自由度は（行数-1)×(列数-1)だよね？中間の説明がないと、なぜ自由度がn-1なのか疑問だわ。。。 …

2018-06-05

統計検定2級_ベルヌーイ試行

統計学勉強

ベルヌーイ試行結局のところ0/1で表せることができる試行どの確率が欲しいかによって分布が異なる。初めて成功するときに使う分布幾何分布 bellcurve.jp ちょうどn回成功するときに使う分布二項分布 bellcurve.jp 試行回数がすごく多くて、起こる確率が…

2018-04-26

エネルギーデータを4年分析してわかったこと

データ分析データ分析建築設備時系列データポエム

概要私は建築物の消費エネルギーのデータ分析(省エネ分析)を4年行ってきました。大学・病院・事務所ビルなど様々な建物のエネルギーデータの分析をさせていただきました。 4年分析してきてわかったことを書きます。お客様はそれほど分析内容に興味がない…

2018-04-10

Dark Skyを使用した天気予測をCSV化する

Python Python データ分析時系列データ API 予測

qiita.com 概要建築物のエネルギーデータを予測するにあたって、空調機の消費電力量が与える影響は非常に大きい。外乱のあるデータを予測するには単変量解析では限界がある。多変量にすべき？翌日の外気温度使えば空調機の消費電力量の予測精度ってもっと…

2018-03-28

Memo:[Django]バージョンによるurls.py内のincludeの仕様の違い

Python 勉強 Django

概要 Urlディスパッチャの記述でハマった。問題旧DjangoのTutorialでは、下記のようにしなければならなかった。 urlpatterns = [ url(r'^testapp/', include('testapp.urls', namespace='testapp')), ] 新しいDjangoで上記を写経すると下記のエラーがでる…