haskell-jp / questions #28

"Testcase 1" で Out of memory になるソースはこちらです　``` {-# LANGUAGE FlexibleInstances, UndecidableInstances, DuplicateRecordFields #-}
module Main where
import Control.Monad
import Data.Array
import Data.List
import System.Environment
import

substringDiff k s1 s2 = bsearch 1 (min n1 n2) f
where
n1 = length s1
n2 = length s2
ar1 = listArray (1,n1) s1
ar2 = listArray (1,n2) s2
ar = array ((0,0),(n1,n2)) $ ((0,0),0):
[((i,0),0) | i <- [1..n1]] ++ [((0,j),0) | j <- [1..n2]] ++
[((i,j),ar!(i-1,j-1) + if ar1!i == ar2!j then 0 else 1) | i <- [1..n1], j <- [1..n2]]
f x = or [ar!(i,j) - ar!(i-x,j-x) <= k | i <- [x..n1], j <- [x..n2], x <= min i j]

bsearch l r p
| l >= r = l
| p m = bsearch m r p
| otherwise = bsearch l (m-1) p
where m = (l+r+1) `div` 2

main :: IO()
main = do
stdout <- getEnv "OUTPUT_PATH"
fptr <- openFile stdout WriteMode
t <- readLn :: IO Int
forM_ [1..t] $ \t_itr -> do
kS1S2Temp <- getLine
let kS1S2 = words kS1S2Temp
let k = read (kS1S2 !! 0) :: Int
let s1 = kS1S2 !! 1
let s2 = kS1S2 !! 2
let result = substringDiff k s1 s2
hPutStrLn fptr $ show result
hFlush fptr
hClose fptr
```

takumaw

2018-09-29 13:36:18 +0900

@takumaw has joined the channel

2018-09-29 15:41:26 +0900

[HERP]()
という会社がHaskellとYesod使っているということを知って興味を持ったので
月曜日に話を聞きに行く予定なのですが
haskell-jpのメンバーにここの社員居たりしますかね

as_capabl

2018-09-29 16:02:46 +0900

プロファイル取ってみました。arのメモリ使用量削減が課題ですかね。

as_capabl

2018-09-29 16:11:14 +0900

おもむろにUnboxed Arrayに変えてみたら、arの右辺でarを使う所で無限ループになりました。Mutable Arrayを使うか、kakkun61さんのようにMemoモナドを使う必要がある模様

as_capabl

2018-09-29 16:57:53 +0900

これで18MBまで減りました。

igrep

2018-10-01 09:54:13 +0900

もう終わった話題だったら申し訳ないんですが、kakkun61さんのコードもタプルをStrictなタプルに変えるとか、適当なところでBangPatternsを使うだけで大分改善されそうな気がします。
（ちょっと試せてないんですが、忘れないうちに。。。）

karoyakani

2018-10-01 13:42:19 +0900

よくよく考えなおしたら　最長解の探索の時に　一つのづれ毎に　２次元テーブルの対角方向しか使っていないので　このテーブルは不要でした　下記のコードで AC になりました　as_capabl さんお勧めの Unboxed Array も使いました　皆さんありがとうございました　　``` {-# LANGUAGE FlexibleInstances, UndecidableInstances, DuplicateRecordFields #-}
module Main where
import Control.Monad
import
import Data.Array.Unboxed
import
import Data.List
import System.Environment
import

substringDiff k s1 s2 = maximum $ g <$> [1-n2..n1-1]
where
n1 = length s1
n2 = length s2
ar1 = listArray (1,n1) s1 :: UArray Int Char
ar2 = listArray (1,n2) s2 :: UArray Int Char
mn = min n1 n2
df = abs (n1-n2)
g y = bsearch 1 n f
where
(i,j) = (max 1 (1+y),max 1 (1-y))
n | n1>n2 = if y-df>0 then mn-y+df else mn+min 0 y
| n1<n2 = if y+df<0 then mn+y-df else mn-max 0 y
| True = mn - abs y
ar :: UArray Int Int
ar = runSTUArray $ do
arM <- newArray_ (0,n)
writeArray arM 0 0
forM_ [1..n] $ \x -> do
prev <- readArray arM (x-1)
writeArray arM x $ prev + if ar1!(i+x-1) == ar2!(j+x-1) then 0 else 1
return arM
f x = or [ar!i - ar!(i-x) <= k | i <- [x..n]]

bsearch l r p
| l >= r = l
| p m = bsearch m r p
| otherwise = bsearch l (m-1) p
where m = (l+r+1) `div` 2

main :: IO()
main = do
stdout <- getEnv "OUTPUT_PATH"
fptr <- openFile stdout WriteMode
t <- readLn :: IO Int
forM_ [1..t] $ \t_itr -> do
kS1S2Temp <- getLine
let kS1S2 = words kS1S2Temp
let k = read (kS1S2 !! 0) :: Int
let s1 = kS1S2 !! 1
let s2 = kS1S2 !! 2
let result = substringDiff k s1 s2
hPutStrLn fptr $ show result
hFlush fptr
hClose fptr
```

igrep

2018-10-05 11:04:19 +0900

難しそうな質問ですみません。HIW 2018にあった
https://icfp18.sigplan.org/event/hiw-2018-papers-coercion-quantification
こちらの発表の内容を理解しようとしているんですが、
出てくる「homogeneous equality」「heterogeneous equality」というキーワードがさっぱりわからず、困っております。
既存の a ~ b ともまた違うっぽいんですが、どう違うんでしょうか？

notogawa

2018-10-05 11:11:02 +0900

homogeneous equality, which means equality is between types of a same kind

だから，同一kindでの関係か異なるkindでの関係かでは？

igrep

2018-10-05 11:13:42 +0900

「異なるkindだけど等しい」という状態がどんな状態なのかちょっとイメージがわかないです。。。 :sweat:

notogawa

2018-10-05 11:37:34 +0900

依存型を用いて長さを型やら種レベルに持つコンテナ X があって，さらにそれに交換則を満たすような結合操作が入っているときに，実際に交換して結合した2つのコンテナの値(型)の型(種)は X (a+b) と X (b+a) みたいなものが出てきますが，たとえばこれらのequalityが扱えないことがあるみたいな話ではないですか．

as_capabl

2018-10-05 13:00:49 +0900

http://hackage.haskell.org/package/base-4.12.0.0/docs/Data-Type-Equality.html ここにhomogeniousな :~: とheterogeniousな :~~: がそれぞれ定義されていますね。後者がなぜ必要なのか、私も理解できてないですが一応。

as_capabl

2018-10-05 13:05:18 +0900

HReflでパターンマッチすれば同じ型(必然的に同じkind)になるけど、マッチ前は異なるkindの型を両辺に書ける、って感じなのか

igrep

2018-10-05 16:42:44 +0900

https://icfp18.sigplan.org/event/hiw-2018-papers-coercion-quantification に張ってあるスライドの17ページに例がありました（スライドのPDFファイルへの直リンはしにくくなってますね。。。）
ややでっち上げた例のようにも感じられますが、

data Rep :: forall k. k -> Type where
  RepBool :: Rep Bool
  RepMaybe :: Rep Maybe

みたいな、任意のkindを内包できる型があった場合に、
Rep Bool と Rep Maybe の（型レベルでの）等値性を比較したい場合に kind errorになってしまう、という例です。

msakai

2018-10-05 17:57:13 +0900

ちなみに、依存型の世界だと heterogenious equality (John Major’s equality) は K を含意するので、通常の homogeneous equality よりも真に強いです。

hexirp

2018-10-05 18:07:34 +0900

a :~~~: b -> a :~~: b が axiom K を含意する、の方が正確なような気がします

hexirp

2018-10-05 18:13:53 +0900

というか a :~: b -> a :~~: b は成り立つのに対して a :~~: b -> a :~: b は成り立たないので heterogenious equality のほうが弱い、といえると私は認識していたんですがこれであってますよね……？

hexirp

2018-10-05 18:25:01 +0900

ちょっと誤解していたんですが a :~~: b -> a :~: b が成り立たないのは Coq においてで、 Haskell では成り立つみたいです。ｽﾐﾏｾﾝ

msakai

2018-10-06 11:49:00 +0900

自分の言っているのは体系の強さの意味です。
通常の除去規則(J)を持つ通常の homogeneous な propositional equality と、 John Major’s equality を比べると、後者を持つ体系で前者は自明に定義できて更にKやUIP(Uniqueness of identity proof)等を満たすのに対して、前者しかない体系で後者を定義することは出来ないです(ただしKもしくはUIPもしくは制限のないパターンマッチがあれば定義できる)。

CoqはKやUIPを前提としない体系(Agdaでの --without-K な状態)なので、 John Major’s equality は Axiom を使って定義されているはずです。 John Major’s equality の除去規則(とその計算規則?)を Axiom にすれば a :~~: b -> a :~: b は証明できるはずですが、何らかの事情で別の定義を使っているのかも知れません。

as_capabl

2018-10-06 13:56:53 +0900

最近ちまちま読んでた論文にも、良く見るとその辺の話めっちゃ出てきてました。 https://arxiv.org/abs/1610.07978 モチベーションとして3.2節で　<@U4LGTMTMK> さんが挙げたような例が出てきて、論理的裏付けとして5章で @hexirp さんや @msakai さんが挙げてるような話が書いてあるっぽい

as_capabl

2018-10-06 13:59:40 +0900

というか著者＝発表者だ

msakai

2018-10-06 15:15:49 +0900

Haskell の話からはかなり脱線してしまいますが、 John Major’s equality の除去規則から通常の propositional equality の K と UIP を示すのを Agda で書いてみました。 https://gist.github.com/msakai/b3f3003b1ec900b84c0e5c6e5315c90b

hexirp

2018-10-06 17:21:47 +0900

Haskell では homogeneous equality を表す型クラス a ~ b は heterogeneous equality を表す型クラス a ~~ b を使って class (a ~~ b) => (a :: k) ~ (b :: k) と定義されていますね。型クラスでは、もしインスタンスがあればそれは一意なので UIP は当然のことといえるかも？a :~: b と a :~~: b の間にはこういう関係はないです。

Yugo Osano

2018-10-07 14:47:37 +0900

@Yugo Osano has joined the channel

tanimocchi

2018-10-07 16:01:45 +0900

仕様と、上手く動かなかったプログラムを添付します。どうしても回数が多いのでOverflowするのと、計算精度が良くないようで結果もおかしな感じとなります。すいませんが、ご教示お願い致します。

{-# LANGUAGE Strict #-}
import System.Environment

qnr :: Double -> Double -> Double -> Double
qnr n r 0 = 0
qnr n r p
  | n < r     = 0
  | n == r    = q
  | otherwise = q + (n-r)*(log(1-p)) + (foldl (+) 0 (map log [n-r+1..n])) - (foldl (+) 0 (map log [2..r]))
  where q = r * (log p)

exp_qnr :: Double -> Double -> Double -> Double
exp_qnr n r p = exp (qnr n r p)

pnr :: Double -> Double -> Double -> Double
pnr n r 0 = 0
pnr n r p
  | n < r     = 0
  | n == r    = exp q
  | otherwise = (pnr (n-1) r p) + (1 - (pnr (n-1) r p))*(exp_qnr n r p)
  where q = r * (log p)

main = do
  args <- getArgs
  (n,r,p) <- case args of
    n':r':p':_ -> (,,) <$> readIO n' <*> readIO r' <*> readIO p'
    _ -> return (6400, 64, 0.8)
  -- putStrLn $ "qnr " ++ show n ++ " " ++ show r ++ " " ++ show p ++ " = " ++ show (exp_qnr n r p)
  putStrLn $ "pnr " ++ show n ++ " " ++ show r ++ " " ++ show p ++ " = " ++ show (pnr n r p)

igrep

2018-10-07 16:04:43 +0900

ソースコードの部分はバッククォート3つで囲っていただけると助かります！

こういう風に
  行頭の
  空白も保存されるので！

参考: https://get.slack.help/hc/ja/articles/202288908-%E3%83%A1%E3%83%83%E3%82%BB%E3%83%BC%E3%82%B8%E3%81%AE%E6%9B%B8%E5%BC%8F%E8%A8%AD%E5%AE%9A#u12452u12531u12521u12452u12531u12467u12540u12489

msakai

2018-10-07 16:16:59 +0900

直観主義型理論でも、 propositional equality はデータ構築子が一つしかないにも関わらず、UIPは証明できないので、この場合もインスタンスの一意性があるからといって自明ではないような気はしますが……

ただ、Haskellでは以下の定義は通るようですね。 (Haskellの型レベルプログラミングに詳しくないので適当ですが)

type family UIP a (x :: a) (e :: x :~: x) :: e :~: Refl where
  UIP a x Refl = Refl

msakai

2018-10-07 16:20:18 +0900

依存型を用いて長さを型やら種レベルに持つコンテナ X があって，

多次元配列の型付けで必要になる、お仕事っぽい話だ…… (^^;

naohaq

2018-10-07 16:47:38 +0900

引数の一部を整数にしてみました https://gist.github.com/naohaq/281aebb3f29378109bb4f866e5068ef8

naohaq

2018-10-07 17:24:38 +0900

漸化式を修正したバージョン https://gist.github.com/naohaq/281aebb3f29378109bb4f866e5068ef8/2c348a0056fa6977e681f2a31b5ccf5e905c5a89

notogawa

2018-10-07 19:50:25 +0900

:innocent:

Hiroto

2018-10-07 21:58:44 +0900

この式は全然わからないけど、

(foldl (+) 0 (map log [n-r+1..n]))

これは次のように書くと計算量は減るんじゃないかな（あと正格foldlも使ってる

foldl' (\acc num -> log num + acc) 0 [n-r+1..n]

Hiroto

2018-10-07 22:00:58 +0900

http://hackage.haskell.org/package/base-4.12.0.0/docs/Data-List.html#v:foldl-39-

algebroid

2018-10-08 15:28:51 +0900

@algebroid has joined the channel

2018-10-09 09:47:59 +0900

ghcで書いたプログラムを
pythonで動かしたいです
jsへのコンパイラはいろいろありますが
pythonに変換するものはありますか？

igrep

2018-10-09 10:13:06 +0900

多分ないです。少なくとも私は聞いたことがありません。
そもそもどういう動機でPythonに変換したいんですか？AWS Lambdaで動かすとか？

notogawa

2018-10-09 10:33:04 +0900

動かしたいだけなら FFI で shared object に変換して，python側で import ctypes から呼び出すのがてっとり早いのではないかと思います．

2018-10-09 12:03:48 +0900

pythonでグラフを表示したいのですが、
今はpythonからpopenしてhaskellで作ったコマンドを呼び出しています。（呼び出しスピードとか気にしてないです）
インストールが面倒でwheelに実行コマンドを含めようかと思ってました。
用途してはこれで十分なのですが、OS別にバイナリをつくるのがそれはそれで面倒で、どうしたものかと。
大したものではないのでpythonで書き直しも考えております。

kazu

2018-10-10 12:50:17 +0900

Data.List.delete って、最初にマッチした要素しか消してくれないのですね。マッチする全部の要素を取り除く関数ってありませんか？

2018-10-10 12:55:27 +0900

代わりに Data.List.filter を使うのはどうでしょう

hiratara

2018-10-10 12:55:40 +0900

それって filter のような気がしますが、汎用的ではない特定の要素を全消しする専用の関数を探しているということです？

hiratara

2018-10-10 12:55:46 +0900

あ、かぶった・・・

kazu

2018-10-10 13:12:04 +0900

あー、filter でいいのか。ありがとうございます！